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(57) Abstract: The invention relates to a comprehensive 
method fw eflBciently configuring and reconfiguring, 
especially for the running lime and also during data 
pfocessing, a collection of modules, whose function and 
nctwoTking can be modified, by means of one or more 
inieicommuiucating configuration units. The precise 
configuratfon hi a complex technical transfonnation is, in 
paiticoko; in the foreground. TWs includes the description 
of the state automatons, of the communications structures, 
of the leconfiguxation execution, and of the protocols 
required each lime. The invention is characterized by 
the ability to effect a pomanenl as well as overiapjring 
leconfiguration without the occunencc of blockings or error 
functions, particularly in the data processing. 

(57) Zusammenfisssung: > Es wird ein umfessendes 
Verfehren zur cfBzicnten Konfiguration und Rekonfign- 
ration, insbesondere zur Laufzeit und auch wShrend der 
Datenverarbeitung. einer Ansanunlung von in ihrcr Funktion 
und Vemetzung veranderbaren Baugruppcn mittds einer 
Oder mchierer mitdnando' kommuniziercnder Konfigura- 
tionseinheitEn vorgeschlagen. Im Voniergnind steht dabei 
insbesondere die genaue Ausgestaltung in einer komplexen 
technischen UmseUung. Dies beinhaltet die Beschreibung 
dCT Zustandsautomaten, der Kommunikationsstmkturen, 
desRckonfiguiationsablanfes und der jeweils crforderlichen 
Protokolle. Wesentliches Merkmal isl die MOglichkeit zur 
st&idigen auch ineinander ttberiappenden Rekonfiguration. 
ohne daB es zu Blockierungen odcr Fehlfunktionen, 
insbesondere der Datenverarbeitung kommt. 
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Pipeline CT-Protokolle und -Koininunikation 

Die vorliegende Erfindung befafit sich mit Verfahren, die eine 
effiziente Konfiguration und Rekonf iguration einer Oder 
mehrerer rekonf igurierbarer Baugruppen durch jeweils eine Oder 
mehrere Konfigurationseinheiten (CT) bei hohen Frequenzen 
ermdglicht. Dabei wird beschrieben, wie zur Steuerung mehrerer 
CTs eine effiziente und synchronisierte Vernetzung aufgebaut 
werden kann. 

Der Begriff Baugruppe bzw, Zelle imfafit klassische FPGA- 
Zellen, Bussysteme, Speicher, Peripherie ebenso wie ALUs und 
Rechenwerke von Prozessoren. Hingewiesen wird in diesem 
Zusammenhang auf die Definitionen des gleichen 
Anmelders/Zessionclrs. Insbesondere wird jede Art von 
konfigurierbaren und rekonf igurierbar en Elementen 
grundsatzlich als Baugruppe verstanden. Ftlr 
Parallelrechnersystem kann eine Baugruppe als kompletter 
Knoten jedweder Funktion (insbesondere jedoch Rechen-, 
Speicher- und Datentibertragungs-funktipnen) verstanden werden • 

Das beschriebene Verfahren ist insbesondere fUr integrierte 
Bausteine xait einer Mehrzahl von ein- oder mehrdimensional 
angeordneten Baugruppen, die direkt oder durch ein Bus system 
miteinander verbunden sind, anwendbar. 

Zur Gattung der Bausteine ;zahlen systolische Arrays, neuronale 
Netze, Mehrprozessor Systeme, Prozessoren mit mehreren 
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Rechenwerken und logischen Zellen, ebenso wie bekannte 
Bausteine der Gattung FPGA, DPGA, XPUTER, etc.. 
In der nachfolgenden Beschreibung werden Bausteine einer 
Architektur verwetidet, deren Rechenwerke und Bussysteme frei 
konfigurierbar sind. Die Architektur ist in DE4 416881, sowie 
PACT02, PACT08, PACTIO, PACT13 bereits ver6f fentlicht und wird 
im folgenden VPU genannt. Diese Architektur besteht aus 
beliebigen arithmetischen, logischen (auch Speicher) oder 
koinmunikativen (10) Zellen (PAEs), die zu einer ein- oder 
mehrdimensionalen Matrix (PA) angeordnet sein konnen, wobei 
die Matrix unterschiedliche beliebig ausgestaltete Zellen 
aufweisen kann, auch die Bussysteme werden dabei als Zellen 
verstanden. Der Matrix als ganzes oder Teilen davon zugeordnet 
ist eine Konfigurationseinheit (CT), die die Vernetzung und 
Funktion des PA beeinflufit. 

Eine besondere Elgenschaft von VPUs ist die automatische und 
deadlockfreie Umkonfiguration zur Laufzeit. Dazu notwendige 
Protokolle und Verfahren sind aus PACT04r 05, 08, 10, 13 bekannt, 
die durch Bezugnahme vollumfcLnglich eingegliedert sind. Die 
Verdffentlichungsnummer zu diesen internen Aktenzeichen finden 
sich im Anhang. 

1. Gmndaus t&nda von PABs nnd Bnsprotofcoll dex Konfxqnration 

Jeder PAE sind Zustdnde zugeordnet, die die Konfigurierbarkeit 
beeinflussen. Ob diese ZustSLnde lokal kodiert sind oder durch 
eine oder mehrere Schaltwerke verwaltet werden, insbesondere 
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die CT selbst, ist dabei unerheblich. Eine PAE kennt 
raindestens zwei Zustande: 

„not configured^* In diesem Zustand ist die PAE inaktiv und 
verarbeitet keine Daten und/oder Trigger. Insbesondere niznmt 
sie keinerlei Daten und/oder Trigger entgegen und generiert 
auch keine Daten und/oder Trigger. Es k6nnen lediglich 
konfigurationsbezogene Daten und/oder Trigger aufgenommen 
und/oder verarbeitet werden. Die PAE ist vollkommen neutral 
und darf konfiguriert werden. Die M5glichkeit zur 
Initialisierung der Register fur zu verarbeitende Daten 
und/oder Trigger insbesondere durch die CT in diesem Zustand 
sei aber hiermit erwfihnt. 

/rconfigured^ Die Funktion und Vernetzung der PAE ist 
konfiguriert. Die PAE verarbeitet und generiert zu 
verarbeitende Daten und/oder Trigger. Solche Zustdnde kdnnen 
auch mebrf ach weitgehend unoQ}hangig voneinander in 
eigenstahdigen Teilen einer PAE enthalten sein. 

Sofern sich die hier relevante Trennung zwischen Daten 
und/oder Trigger filr die Verarbeitung einerseits und Daten 
und/oder Trigger fUr die Konfiguration einer oder mehrere 
Zellen andererseits nachfolgend aus dem Zusammenhang ergibt 
wird sie nicht durchgehend explizit angefQhrt. 

Die CT sendet bei der Konfiguration zusammen mit einem 
gttltigen Konfigurationwort (ECW) ein Signal, das die GUltigkeit 
anzeigt (RDY) . Dies kann entfallen, wenn die Gflltigkeit auf 
andere Weise sichergestellt ist, zum Beispiel bei 
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kontinuierlichem Senden Oder durch eine Kodierung im KW. 
Weiterhin ist im allgemeinen in eineia KW die Adresse der zu 
konfigurierenden PAE kcxiiert. 

Eine PAE entscheidet nach nachfolgend und in den unter Bezug 
genonimenen Anmeldungen beschriebenen ECriterien, ob sie in der 
Lage ist, die KW anzunehmen und ihre Konfiguration zu 
verandern oder ob die Datenverarbeitung nicht durch eine neue 
Konfiguration unterbrochen oder verfaischt werden darf . In 
jedem Fall wird die Information, ob Konfigurationen angenoinmen 
werden oder nicht, an die CT weitergeleitet, falls die 
Entscheidung nicht schon dort stattfindet. Folgendes Protokoll 
ware mOglich: Sofern eine PAE die Konfiguration akzeptiert, 
sendet sie die Quittung ACK (acknowledge) an die CT. Sofern 
die Konfiguration abgelehnt wird, zeigt eine PAE dies durch 
Senden von RE J (reject) der CT an. 

Innerhalb der datenverarbeitenden Elemente (PAEs) wird von 
diesem bzw. diesen entschieden, ob sie umkonfiguriert werden 
kOnnen^ da die Datenverarbeitung beendet ist, oder ob sie noch 
Daten verarbeiten. Zudem werden durch unkonfigurierte PAEs 
keinerlei Daten verfSlscht. 

2. Deadlock-Freiheit und Korrektheit d<s>r Daten 
2.1 maflO-grdLnzip 

Wichtig ist nun die effiziente Verwaltung einer Vielzahl von 
Konfigurationen, die jeweils aus einem oder mehreren KW und 
eventuell welteren Steuerbefehlen bestehen und aberlappend auf 
das PA konfiguriert werden kOnnen. Dies liegt daran daB 
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oftmals eine grofie Entfernung zwischen der CT und der bzw. den 
zu konfigurierenden Zellen besteht, was bei der Obertragung 
von Konfigurationen nachteilig ist. Gleichzeitig wird von der 
Technologie sichergestellt, dafi durch eine Rekonfiguration 
keine Daten oder ZustSnde verfSlscht werden. Dazu werden 
folgende Regeln definiert, die das FILMO-Prinzip genannt 
werden: 

a) PAESr die aktuell Daten verarbeiten, werden nicht 
umkonfiguriert. Eine Umkonfiguration soil erst stattfinden, 
wenn die Datenverarbeitung vollstSndig abgeschlossen ist 
Oder sichergestellt ist, daB keine weitere 
Datenverarbeitung mehr erforderlich ist. (Erkiarung: Das 
Umkonfigurieren von PAEs, die aktuell Daten verarbeiten 
Oder auf noch ausstehende Daten warten, ftihrt zur 
fehlerhaften Berechnung oder dem Verlust von Daten.) 

b) Der Zustand einer PAE soli sich nicht Wclhrend eines FILMO 
Durchlaufes von /,konfiguriert'^ auf ,^unkon£iguriert^^ dndern. 
Nachfolgend wird zusStzlich zum Verfahren nach PACTlO ein 
besonderes zusStzliches Verfahren beschrieben, das 
Ausnahmen zuiafit (Explizit/Implizit LOCK) . Dies hat 
folgende Bewandnis auf sich: Wenn eine SubConf verstanden 
wird als eine MEnge von Konfigurationsworten, die zu 
gegebener Zeit bzw. zu gegebenezn Zweck gemeinsam in das 
Zellarray hineinkonfiguriert werden sollen, kann eine 
Situation auftreten, wo zwei verschiedene SubConf (A, 
D)die3elben Ressourcen teilen sollen, insbesondere eine PAE 
X. SubConf A liegt z.B. zeitlich vor SubConf D. Somit muB 
SubConf A die Resourcen vor SubConf D belegen. Wenn nun PAE 
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X zuitt Konfigurationszeitpunkt von SubConf A noch 
„konfigurierf ist, aber vor der Konfiguration von SubConf 
D den Zustand auf ,,.unkonfiguriert^* wechselt, kann ohne 
besondere Mafinahmen eine Deadlock Situation entstehen, wenn 
n&nlich SubConf A die PAE X nicht mehr konfigurieren kann 
und SubConf D zB nur PAE x belegt, aber die restlichen 
Resourcen, die bereits von SubConf A belegt slnd nicht mehr 
konfigurieren kann, Weder SubConf A noch SubConf D kdnnen 
ausgefahrt werden. Es entstUnde ein Deadlock, 
c) Eine SubConfsoll alle zu ihr gehdrenden PlVEs entweder 
erfolgreich konfiguriert Oder alloziiert haben oder eine 
Zurackweisung (REJ) erhalten haben, bevor die nachfolgende 
SubConf konfiguriert wird. Dies gilt jedoch nur, wenn die 
beiden Konfigurationen ganz Oder teilweise dieselben 
Ressourcen teilen. Glbt es keinen Ressourcenkonfliktr 
k6nnen beide SubConf unabhangig voneinander konfiguriert 
werden. Auch wenn bei einer SubConf PAEs die Konfiguration 
verweigerten (REJ), wird die Konfiguration der 
nachfolgenden SiabConf durchgefUhrt • Da sich der Status von 
PAEs wahrend eines FILMO Durchlaufes nicht Mndert (LOCK, 
gemMB Abschnitt b) ) ist sichergestellt, daB in der 
nachfolgenden Konfiguration keine PAEs konfiguriert werden, 
die die vorhergehende Konfiguration bendtigt hatte. 
Erkiarung: WUrde eine spatere zu konfigurierende SubConf 
die PAEs einer zuvor zu konfigurierenden SubConf 
alloziiern, tritt ein Deadlock ein, da keine SubConf mehr 
vollstandig konfiguriert werden kann. 
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d) Innerhalb einer SubConf kann es erforderlich seinr dafi 
bestimmte PAEs in einer bestimmten Reihenfolge konfiguriert 
bzw. gestartet warden. Erklarung: Eine PAE darf 
beipielsweise erst auf einen Bus aufgeschaltet werden, 
nachdeia der Bus auch fUr die SiibConf konfiguriert ist. Eine 
Aufschaltung auf einen fremden Bus wUrde zur Verarbeitung 
falscher Da ten fOhren. 

e) Bei bestiinmten Algorithmen muB die Reihenfolge der 
Konfiguration von SubConf gegebenenfalls exakt der 
Reihenfolge der bei der CT eingehenden Trigger entsprechen. 
Geht beispielsweise der Trigger, der die Konfiguration von 
SubConf 1 ausldst, vor dem Trigger, der die Konfiguration 
von SubConf 3 ausl5st, ein, mu£ SubConf 1 vollstMndig 
konfiguriert sein, bevor SubConf 3 konfiguriert werden 
darf. Wird die Reihenfolge der Trigger vertauscht, kann 
dies, je nach Algorithmus zu einer fehlerhaften Abfolge der 
Teilgraphen (SubConf, vgl. PACT13) ftthren. 

Verfahren die weitgehend vielen oder alien der oben genannten 
Anforderungen genfigen, sind aus PACT05 und PACTIO bekannt. 

Die Verwaltung der Konfigurationen, ihr zeitliches Timing und 
die Anordnung und Ausbildung der zugehOrigen Bauelemente, 
insbesondere der Konfigurationsregister usw. hat sich jedoch 
als ftir die beschriebene Technik fundamental herausgestellt 
und es sollen daher noch mOgliche Verbesserungen des bekaimten 
Standes der Technik erCrtert werden. 
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Die Aufgabe der vorliegenden Erfindung besteht darin, Neues 
ffir die gewerbliche Anwendung bereitzustellen. 

Die Ldsung dieser Aufgabe wird in unabhangiger Form 
beansprucht. Bevorzugte Ausffihrungsformen finden sich in den 
UnteransprOchen . 

Om bedarfsweise die Anforderungen e) sicherzustellen, wird 
vorgeschlagen, eingehende Trigger, die auf den Status einer 
SubConf bzw. einer Zelle und/oder einer Rekonfigurierbarkeit 
bezogen sind, mittels eines einfachen - insbesondere der CT 
zugeordneten - FIFOs in der korrekten Reihenfolge zu 
speichern. Jeder FIFO-Eintrag enthalt die in einem Takt 
eingegangenen Trigger, wobei insbesondere alle in einem Takt 
eingegangenen Trigger gespeichert werden kdnnen. Treten keine 
Trigger auf, wird auch kein FIFO-Eintrag generiert. Die CT 
arbeitet den FIFO in der Reihenfolge der eingehenden Trigger 
ab. Enth^lt ein Eintrag mehrere Trigger, arbeitet die CT 
wahlweise entweder (i) priorisiert oder (ii) unpriorisiert 
zunSchst jeden Trigger einzeln ab, bevor der nSchste FIFO- 
Eintrag bearbeitet wird. Da ein Trigger gewOhnlicherweise nur 
einmal pro Konfigurationen an die CT gesendet wird, ist es far 
gewdhnlich ausreichend, die Maximaltiefe des FIFOs auf die 
Menge aller an die CT verdrahteten Triggerleitungen 
festzusetzen. Ms alternatives Verfahren kann auch ein Time- 
Stamp-Frotokoll entsprechend PACT18 angewendet werden. 

Aus FACTIO sind zwei grundlegende FILMO-Arten bekannt: 
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Separator FILMO: Der FILMO ist als separater Speicher 
ausgefQhrt und vom normalen CT~Speicher, der die SxibConf 
cached getrennt. Nur KWs die nicht in das PA konfiguriert 
werden konnten, werden in den FILMO kopiert. 
Integrierter FUMD: Der FILMO ist im CT-Speicher integriert. 
KWs die nicht konfiguriert werden konnten werden mittels Flags 
und Pointern verwaltet. 

Die nachfolgend beschriebenen erfindungsgemafien Verfahren sind 
entweder auf beide FILMO-Arten oder eine bestimmte Art 
anwendbar • 



2.2 Di££erentielle Rekonflguration 

Bei vielen Algorithmen ist es sinnvoll wUhrend des Betriebes 
aufgrund bestixnmter Ereignisse, die durch Trigger oder 
zeitliche Abstimmung reprSsentiert werden, die Konfiguration 
nur minimal zu Sndem, ohne dafi die Konfiguration der PAEs 
kon5>lett geiascht wird. In den meisten Fallen betrifft dies 
die Verschaltung der Bussysteme oder bestimmte Konstanten. 
Soil beispielsweise nur eine Konstante geSndert werden^ ist es 
sinnvoll, ein KW in die betreffende PAE schreiben zu ktanen, 
ohne dafi die P2VE im Zustand ,,unkonfiguriert'^ ist. Dies 
vermindert die Menge an zu tlbertragenden Kof igurationsdaten 
und ist daher vorteilhaft. Erreicht werden kann dies mit einem 
Konfigurationsmodus ,,differentielle Rekonf iguration** . Dabei 
enthait das iCW beim Schreiben des KW kodiert oder explizit 
die Information DIFFERENTIAL. DIFFERENTIAL zeigt an, dafi das 
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KW an eine bereits konfigurierte PAE gesendet werden soli. Die 
Akzeptanz der differentiellen Konfiguration und die 
Quittierung ist genau imgekehrt zur normalen Konfiguration: 
Eine konfigurierte PAE nimmt das KW entgegen und sendet ein 
ACK. Eine unkonfigurierte PAE verweigert die Annahme des ECW 
und sendet REJ, da Voraussetzung ftir DIFFERENTIAL eine 
konfigurierte PAE ist. 

Es gibt nun verschiedene Mdglichkeiten, die differeentielle 
Rekonfiguration durchzuf Uhren . Entweder es wird die 
differentiele Rekonfiguration ohne Rticksicht auf den 
tatsachlich z.B. in einer Zelle ablaufenden 
Datenverarbeitungs-ProzeB erzwungen; dann ist es 
wttnschenswert, eine exakte Synchronisation mit den 
Datenverarbeitungen zu gew^hrleisten, was durch entsprechende 
Gestaltung und Auslegung des Prpgrames geschehen kann. Urn den 
Programmierer von dieser Aufgabe zu entlasten, kann aber die 
differentielle Rekonfigurierbarkeit auch abhangig gemacht 
werden von anderen Ereignissen, beispielsweise dem Vorliegen 
eines bestimmten Zustandes in einer anderen oder der partiell 
umzukonfigurierenden Zelle. Eine besonders bevorzugte Variante 
ist daher/ die Konfigurationsdaten, insbesondere 
differentiellen Konfigurationsdaten in oder bei der Zelle zu 
spelchern, etwa in einem dedizierten Register und dann 
abhangig von einem bestimmten Zustand den Registerlnhalt 
abuzrufen bzw. in die Zelle einzulesen. Dies kann z.B. durch 
Umschalten eines Multiplexers geschehen. 
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Auch kOnnen die nachfolgend beschriebenen Methoden der Wave 
Rekonflguration verwendet warden. Ebenfalls ist es 
gegebenenfalls sinnvoll, eine differentielle Konf iguration von 
dem Erfolg (ACK/REJ) einer zuvor normal durchgeftthrten 
Konf iguration abh^ngig zu machen. Mit anderen Worten wird die 
differentielle Konfiguration nur nach Eintreffen des ACKs ftir 
die vorhergehende nicht Differentiellen durchgef tlhrt . 

Eine besonders bevorzugte Variante der Synchronisation der 
dif ferententiellen Kofiguration ist allgemein anwendbar und 
zwar unabhangig davon, wie viele unterschiedliche 
differentielle Konfigurationen tatsMchlich benotigt werden. 
Dies wird ezm6glicht, indem die differentielle Konfiguration 
nicht lokal vorgespelchert wlrdr sondern mit einer ersten 
Zelle auf das Erkennen eines bestlmmten Zustandes/ 
beisplelsweise elnes Dateneingabe-Endes oder dergl., ein 
Signal generlert wird, das die dlfferentiell 
umzukonfigurlerende Zelle anhait. Ein solches Signal kann ein 
STOP-Signal sein. Nach oder gleichzeitig mit dem Anhalten der 
Datenverarbeitung In der dlfferentiell urazukonfigurierenden 
Zelle wird ein Signal an die CT gesendet, das zum 
differentiellen Umkonf Igurieren der angehalten Zelle 
auffordert. Dieses Aufforderungsslgnal zum differentiellen 
Umkof igurieren kann Insbesondere von jener Zelle erzeugt und 
gesendet werden, welche auch das STOP_Slgnal generlert. Die CT 
wird dann die zur differentiellen Rekonflgiirlerung 
erforderllchen Daten an die angehaltene Zelle senden und so 
die differentielle Rekonflgurlerung bewlrken. Nach der 
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differentiellen Rekonfigurierung wird der STOP_Modus 
aufgehoben; dies kann insbesondere durch die CT veranlafit 
werden. Es sei darauf hingewiesen, daB bei dem Verfahren der 
differentiellen Rekonfigurierung auch Cache-Techniken 
einsetzbar sind. 



3, Aufqaabe der Triqy r 

In VPU Bausteinen werden zur Obertragung einfacher 
Infomationen wie nachfolgend beispielhaft aufgelistet 
bevorzugt sogenannte Trigger verwendet. Trigger werden mittels 
eines beliebigen insbesondere konfigurierbaren Bussystems 
(Netzwerk) ttbertragen. Quelle und Ziel eines Triggers sind 
programitiierbar . 

Eine Vielzahl von Triggern kann innerhalb eines Bausteins 
gleichzeitig llbertragen werden. In besonderen Ausgestaltungen 
ist auBer der direkten Obertragung von einer Quelle zu einem 
Ziel auch die Obertragung einer Quelle an mehrere Ziele oder 
mehrerer Quellen an ein Ziel maglich. 

Trigger iibertragen vor allem, jedoch nicht ausschliefilich 
* Statusinformationen von Rechenwerken (ALDs) wie 

- Carry 

- Division by Zero 

- Zero 

- Negativ 

- Under- /Overflow 
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* Ergebnisse von Vergleichen 

* n-bit Inforraationen (fttr kleine n) 

* Interruptanforderungen, die intern oder extern 
generiert werden 

* Blockier- und FreigabeauftrcLge 

* Anforderungen von Konfigurationen 

Trigger werden von beliebigen Zellen generiert und werden 
durch beliebige Ereignisse in den einzelnen Zellen ausgelost^ 
Beispielsweise kann das Status- und/oder Flagregister von ALUs 
Oder Prozessoren nach dem Stand der Technik zur Generierung 
von Triggern verwendet werden, Auch kdnnen Trigger von einer 
CT und/oder einer externen Einheit, die aufierhalb des 
Zellarrays oder des Bausteines angeordnet ist, generiert 
werden . 

Trigger werden von beliebigen Zellen eiq>fangen und auf 
beliebige Art ausgewertet. Insbesondere k6nnen Trigger von 
einer CT oder einer externen Einheit, die auBerhalb des 
Zellarrays oder des Bausteines angeordnet ist, ausgewertet 
werden - 

Ein wesentlicher Einsatzbereich von Triggern ist das 
Synchronisieren und Ansteuern von bedingten Ausffihrungen 
und/oder Ablaufsteuerungen im Array, die z.B. durch Sequenzern 
realisierbar sind, sowie deren Informationsaustausch. 

3,1 Semantik von Triggern 

Trigger werden beispielsweise fUr folgende Aktionen innerhalb 
von PAEs verwendet: 
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STEP: Ausftihren einer Operation innerhalb einer PAE bei 
Eintreffen des Triggers. 

GO: AusfQhren von Operationen innerhalb einer PAE bei 
Eintreffen des Triggers- Die AusfQhrung wird durch STOP 
angehalten. 

STOP: Stoppen der mit GO gestarteten AusfOhrung; vgl, hierzu 
auch die vorstehenden Ausfiihrungen zum STOP-Signal 
LOCAL RESET: Stoppen der AusfOhrung und Obergang vom Status 
,,allocated'> oder ^configured*" in den Status ^not configured". 
HAVE: TVnhalten der AusfOhrung von Operationen und Laden einer 
von der CT zu ladenden sog. Wave-Rekonfiguration. 
Bei einer WAVE-Rekonfiguaration soil eine oder mehrere PAEs 
nachfolgend zum Durchlaufen des Endes eines Datenpaketes 
rekonfiguriert werden. Es soli dann bevorzugt direkt und 
unmitellbar nach der Rekonfiguration, die auch als 
differentielle Rekonfiguration erfolgen kann, die Verarbeitung 
eines weiteren Datenpaektes erfolgen. Beispielsweise soil ein 
erstes Audiodatenpaket mit ersten Filterkoeefizienten 
verarbeitet werden; nach Durchlaufen des ersten 
Audiodatenpaketes soil eine partielle REkonfigurierung 
erfolgen und es soil dann mit eienm zweiten 

Filterkoeffizientensatz ein unterschiedliches Audiodatenpaket 
verarbeite werden. Dazu k6nnen die neuen 

Rekonfigurationsdaten, z.B. die zweiten Filterkoef fizienten, 
in Oder bei der Zelle abgelegt werden und auf das Erkennen des 
Endes des ersten Datenpaketes die Umkonfigurierung automatisch 
veranlaBt werden, ohne daB hierftlr z.B. noch das weitere 
Eingreifen einer CT oder anderen externen Steuereinheit 
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erforderlich sein mu^. Das Erkeimen des Endes des ersten 
Datenpaketes bzw. des Zeitpunktes. an dem die Rekonf iguration 
durchgeftihrt werden soil, kann durch das Generieren eines 
Wave-Rekonfigurations-Triggers geschehen. Dieser kann z.B. in 
einer jeweils ein Datenende erkennenden Zelle erzeugt werden; 
eine Umkonfiguriening ISuft dann mit dem Trigger von Zelle zu 
Zeller sobald diese die Verarbeitung des ersten Datenpaketes 
jeweils abgeschlossen haben, vergleichbar dem Durchlaufen 
einer LA OLA durch ein FuBballstadimn. Dazu kann eine einzelne 
Zelle den Trigger generieren und z.B. an eine erste Zelle 
senden, um ihr anzuzeigen, daii das Ende eines ersten Paketes 
durchiauft. Diese von der Wave-Triggergenerierzelle 
angesprochene erste umzukonfigurierende Zelle reicht 
insbesondere zeltgleich mit den aus den letzten Oaten des 
ersten Paketes hergeleiteten Ergebnissen, die an eine oder 
mehrere nachfolgend verarbeitende Zellen gesendet werden, an 
diese nachfolgend verarbeitenden Zellen auch das Wave- 
Triggersignal weiter. Das Wavetriggersignal kann dabei zudem 
insbesondere auch an solche Zellen gesendet bzw. 
weitergeleitet werden, die derzeit nicht mit der Verarbeitung 
des ersten Datenpaketes befafit sind und/oder keine aus den 
letzten Daten hergeleiteten Ergebnisse erhalten. Dann wird die 
erste von der Wave-Triggersignalgenerienden Zelle 
angesprochene umzukonfigurierende Zelle umkonfiguriert und 
nimmt die Verarbeitung der Daten des zweiten Datenpaketes auf ; 
wahrend dieser Zeit sind nachfolgende Zellen noch beschaftigt 
mit der Bearbeitung des ersten Datenpaketes, Es sei erwahnt, 
daB die Wave-TRiggersignalgenerierende Zelle nicht nur eine 
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einzelne Zelle ansprechen kann, sondern mehrere 
umzukonfiguriernde Zellen. So kann sich eine lawinenartige 
Portpflanzung der Wave-Konfiguration ergeben. 

Sobald die Wave-Rekonfiguration vollstSndig konfiguriert ist, 
wird die Datenverarbeitung fortgesetzt. Bei WAVE kann 
selektiert werden, ob sofort nach vollstandiger Konfiguration 
die Datenverarbeitung fortgesetzt wird, oder auf das 
Eintreffen eines STEP oder GO gewartet wird. 

SELECT: Selektiert einen Eingangs-Bus zur Weiterleitung an den 
Ausgang. Beispiel: Entweder der Bus A oder B soil auf einen 
Ausgang geschaltet werden. Durch SELECT wird die Stellung des 
Multiplexers und damit die Auswahl des Busses gew^hlt. 

Trigger werden beispielsweise far falgende Aktionen innerhalb 
von CTs verwendet: 

CCM7IG: Eine Konfiguration soli durch die CT in das PA 
konfiguriert werden. 

KffiLOaD: Eine Konfiguration soil von der CT in deren lokalen 
Speicher vorgeladen werden. Dadurch muB die Konfiguration 
nicht erst bei Eintreffen von CONFIG geladen werden. Es 
entsteht ein der Effekt eines vorhersagbaren cachings. 
CLEAR: Eine Konfiguration soil von der CT aus deren Speicher 
gel5scht werden. 

Eingehende Trigger referenzieren dabei eine bestinimte 
Konfiguration. Das entsprechende Verfahren wird nachfolgend 
beschrieben. 
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Die Semantik ist nicht einem Trigger-Signal im Netzwerk 
zugeordnet. Vielmehr repr^sentiert ein Trigger lediglich einen 
Zustand. Wie dieser Zustand von der jeweiligen empfangenden 
P2^ genutzt wird, ist in der empfangenden PAE konf iguriert . 
Mit anderen Worten, die sendende PAE sendet lediglich ihren 
Zustand, die empfangende PAE generiert die far sie gtlltige 
Semantik. Empfangen mehrere PAEs einen Trigger, kann in jeder 
PAE eine andere Semantik verwendet werden, d-h. eine andere 
REaktion erfolgen. So kann etwa eine erste PAE gestoppt und 
eien zweite PAE umkonf iguriert ewrden. Senden mehrere PAEs 
einen Trigger, kann das den Trigger generierende Ereignis in 
jeder PAE ein anderes sein. 

Es sei erw^hnt, dafi auch bei Bussystemene usw. eine Wave- 
Rekonfiguration und/oder eine partielle Rekonfiguration 
erfolgen kann. Eine partielle REkonfigurationeines Busses kann 
beispielsweise bei der nur abschnittsweisne REkonfiguration 
erfolgen. 

3.2 Systeaast&tps und ProqgaminzeiqQr 

Ein System ist je nach Implementierung ein Baustein oder eine 
miteinander gekoppelte Gruppe von Bausteinen. Zur Verwaltung 
eines Arrays aus PMs - das bei einem System 
baustelnObergreifend ausgestaltet ist - ist es nicht sinnvoll 
den Zustand Oder Programmzeiger jeder PAE zu kennen. Zum 
naheren VerstSndnis wird zwischen mehreren FMllen 
unterschieden : 
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o PAEs als Bauelemente ohne Prozessoreigenschaft . Derartige 
PAEs benOtigen keinen eigenen Programmzeiger. Der 
Zustand einer einzelnen PAE ist meist bedeutungslos, da 
nur bestiimnte PAEs einen nutzbaren Zustand besitzen (vgl. 
PACTOl : Dort ist der Zustand, der durch eine PAE 
reprasentiert ist/ kein Prograinnicounter, sondern ein 
Datencounter) . Der Zustand einer Gruppe von PAEs wird 
durch die Verkntipfung der Zustande der einzelnen 
relevanten PAEs bestimmt, Mit anderen Worten 
reprclsentiert die Information innerhalb des Netzwerkes 
der Trigger den Zustand - 

o PAEs als Prozessoren , Diese PAEs besitzen einen eigenen 
internen Programmzeiger und Status. Bevorzugt wird 
lediglich die Information einer PAE, die far die anderen 
PAEs Oder eine andere PAE relevant ist, durch Trigger 
ausgetauscht. 

Die Interaktion der PAEs untereinander ergibt einen 
gemeinsamen Status, der ausgewertet werden kann, etwa in 
der CT, urn zu bestimmen, wie eine Neukonf iguratiuon 
erfolgen soil. Dabei kann gegebenenfalls berQcksichtigt 
werden, wie jeweils das evtl. konfigurierbare Netzwerk der 
zur TriggerObertragung verwendeten Leitungen bzw. Busse 
momentan konfiguriert ist. 
Das Array aus PAEs (PA) besitzt somit einen globalen Zustand. 
Die wesentliche Information wird durch bestiramte Trigger an 
die CT geftlhrt, die anhand derer die ProgrammausfUhrung durch 
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Rekonfiguration steuert. Besonders bemerkenswert ist, daB 
daiait kein PrograramzShler mehr existiert, 

4 > (Re) Konf iquga-tion 

VPU Bausteine werden aufgrund von Ereignissen konfiguriert 
Oder umkonfiguriert. Diese Ereignisse k6nnen durch Trigger 
(CONFIG) reprasentiert werden, die an eine CT tibertragen 
werden. Ein eingehender Trigger referenziert eine bestimmte 
Konfiguration (SubConf) ftlr bestimmte PAEs. Die referenzierte 
SubConf wird an eine oder mehrere PAEs gesendet. 
Die Referenzierung geschieht mittels eines Lookup-Systems nach 
dem Stand der Technik Oder einer beliebigen anderen 
Adressumsetzung bzw. -generierung . Beispielsweise kannte 
folgendermafien anhand der Nummer eines eingehenden Triggers 
die Adresse der auszuftlhrenden Konfiguration (SubConf) 
berechnet werden, wenn die SubConf eine feste Ltoge besitzen: 
Offset + (Triggernummer * SubConfLSnge) . 

VPU Bausteine kennen drei Konfigurationsmodi: 

a) Globale Konfiguration, die gesamte VPU wird umkonfiguriert. 
Die gesamte VPO muB sich in einem konfigurierbaren Zustand 
befinden, d.h. mufi unkonfiguriert sein. 

b) Locale Konfiguration, ein Teil der VPU wird umkonfiguriert. 
Der lokale Teil der VPU, der umkonfiguriert werden soil, muB 
sich in einem konfigurierbaren Zustand befinden, d.h. muB 
unkonfiguriert sein. 
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c) Differentielle Konfiguration, eine bestehende Konfiguration 
wird modifiziert. Die PAEs, die umkonfiguriert werden sollen, 
mussen sich in einem konfigurierten Zustand befinden, d.h. mufi 
konfiguriert sein. 

Eine Konfiguration besteht aus einer Menge von 
KonfigurationswOrtern (KWs) • Jede Konfiguration kann per se 
referenziert werden, beispielsweise durch eine Referenznunmer 
(ID), die bedarfsweise eindeutig sein kann. 

Im folgenden soil eine durch eine ID gekennzeichnete Menge von 
KWs als SubConfiguration (SubConf) bezeichnet werden. In einer 
VPO kbnnen mehrere sowohl unterschiedliche/ als auch 
gleichartige SubConf konfiguriert sein, die gleichzeitig auf 
unterschiedlichen PAEs ablaufen. 

Bine PAE kann ein Oder mehrere Konfigurationsregister 
besitzten, wobei je ein Konfigurationswort (KW) ein 
Konfigurationsregister beschreibt, Einem KW ist grundsatzlich 
die Adresse der zu konfigurierenden PAE zugeordnet. Ebenso 
sind einem KW gewOhnlicherweise Informationen, die die Art der 
Konfiguration angeben zugeordnet, Diese Informationen konnen 
technisch durch Flags oder eine Kodierung realisiert werden. 
Flags werden nachfolgend detailliert beschrieben. 

4.1 MbdnllD 
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Ftlr die meisten Operationen ist es ausreichend, dafi die CT die 
Zuordnung eines Konfigurationswortes und der betreffenden PAE 
zu einer SubConf kennt. Far komplexere Operationen im 
Processing Array ist es jedoch sinnvollr in jeder PAE die ID 
der ihr zugeordneten SubConf zu speichern- 

Eine innerhalb des PA gespeicherte ID wird zur Unterscheidung 
der ID innerhalb der CTs im Folgenden ModulID genannt. 
Es gibt mehrere Grtinde fQr die EinfOhrung der ModulID, einige 
sollen beschrieben werden: 

o Eine PAE darf nur auf einen Bus auf geschaltet werden, der 
auch zu der entsprechenden SubConf geh6rt. Wird eine PAE 
auf einen falschen (fremden) Bus auf geschaltet, kann dies 
zur Verarbeitung falscher Daten fUhren. Grunds^tzlich 
kann dieses Problem dadurch gelOst werden, daB Busse 
zeitlich vor PAEs konfiguriert werden, was zu einer 
Starr en Reihenfolge der KW innerhalb einer SubConf ftlhrt- 
Durch die EinfOhrung von ModulID kann dies umgangen 
werden, indem eine PAE ihre gespeicherte ModulID mit der 
der ihr zugeordneten Busse vergleicht und sich erst dann 
auf einen Bus aufschaltet, wenn dessen ModulID mit der 
der PAE abereinstinimt. Solange die beiden ModulIDs 
unterschiedlich sind, wird die Busverbindung nicht 
aufgebaut. Alternativ ist eine Bussharingverwaltung 
realisierbar, vgl. PAct 07, 

o PAEs k6nnen durch ein Signal LocalReset in den Zustand 
r,unkonfiguriert^ versetzt werden. Local Reset get von 
einer PAE im Array aus und nicht von einer CT; daher 
„lokal^. 
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Dazu muB das Signal zwischen alien PAEs einer SubConf 
verbunden werden. Problematisch wird dieses Vorgehen, 
wenn eine SiibConf geldscht werden soli, die noch nlcht 
vollstandig konfiguriert wurde und daher nicht alle PAEs 
an LocalReset angeschlossen sind. Mittels der ModulID 
kann die CT einen Befehl an alle PAEs broadcasten. Die 
PAEs mit der entsprechenden ModulID wechseln ihren 
Zustand auf „unkonfiguriert^' 
o In manchen Applikationen darf eine SubConf erst zu einem 
bestimmten Zeitpunkt gestartet werden, kann aber bereits 
vorher konfiguriert werden. Mittels der ModulID kann die 
CT einen Befehl an alle PAEs broadcasten. Die PAEs mit 
der entsprechenden ModulID starten daraufhin die 
Datenverarbeitung . 

Grundsatzlich kann die ModulID auch mit der in der CT 
gespeicherten ID tibereinstimmen. 

Die ModulID wird in ein Konfigurationsregister in der 
jeweiligen PAE geschrieben. Da IDs ftir gewOhnliche eine 
erhebliche Breite von zumeist mehr als 10 Bits aufweisen, ist 
das Bereitstellen eines derart grofien Registers in jeder PAE 
ineffizient. 

Es wird daher vorgeschlagen die ModulID der jeweiligen SubConf 
von der ID abzuleiten, daA sie eine geringe Breite besitzt und 
eindeutig ist. Da die Menge aller Module innerhalb eines PA 
typisch vergleichsweise gering ist, ist eine ModulID Breite 
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von wenigen Bits (z.B. 4-5 Bits) ausreichend. ModulID und ID 
sind bijektiv aufeinander abbildbar. Mit anderen Worten 
identifiziert die ModulID ein konfiguriertes Modul eindeutig 
innerhalb eines Arrays zu einem bestimiatexi Zeitpunkt. Die 
ModulID wird vor der Konfiguration einer SubConf so vergeben, 
daA die SubConf zur Ausfdhrungszeit eindeutig Im PA 
identifizierbar ist. Sine SubCon£ kann mehrfach gleichzeitig 
in das PA konfiguriert sein (vgl. Makros, nachfolgend 
beschrieben) . Zur eindeutigen Zuordnung wird far jede 
konfigurierte SubConf eine eindeutige ModulID vergeben. 

Die Obersetzung einer ID auf eine ModulID kann tlber Lookup- 
Tabellen oder Listen ablaufen. Da hierzu zahlreiche 
Abbildungsverfahren bekannt sind, soli nur eine Mdglichkeit 
genauer eriautert werden: 

Eine Liste deren LSnge 2**^^° betrSgt enthSlt die Menge aller 
aktuell im Array konfigurierten IDs, wobei je einem 
Listeneintrag eine ID zugeordnet ist. Der Eintrag „0^^ 
kennzeichnet eine unbenutzt ModulID. Wird eine neue ID 
konfiguriert, muB diese einem freien Listeneintrag zugeordnet 
werden, dessen Adresse die entsprechende ModulID ergibt. Die 
ID wird in an der Adresse ModulID in die Liste eingetragen. 
Beim Laschen einer ID wird der entsprechende Listeneintrag 
wieder auf ,,0^' gesetzt. 

4.2 PAB Zttstande 
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Jedes KW ist mit zusfitzlichen Flags versehen, die den Zustand 
einer PAE prQfen und steuern: 

CHECK: Eine unkonf igurierte PAE wird alloziert und 
konfiguriert. Sofern der Zustand der PAE ^unkonfiguriert^^ istr 
wird die PAE mit dem KW konfiguriert. Der Vorgang wird mit ACK 
quittiert . 

Befindet sich die PAE im Zustand „konfiguriert^^ oder 
„allocated*\ wird das BCW nicht akzeptiert. Die ZurQckweisung 
wird mit RE J quittiert. 

Nach Eintreffen von CHECK geht eine PAE in den Zustand 
,,allocated'^ Ober. Jeder weitere CHECK wird zurtickgewiesen, die 
Datenverarbeitung wird jedoch nicht gestartet. 
DIFFEPENTIAL: Die Konf igurationsregister einer bereits 
konfigurierten PAE werden modifiziert. Sofern der Zustand der 
PAE „konfiguriert^^ oder „allocated^ ist, wird die PAE mit dem 
KW modifiziert. Der Vorgang wird mit ACK quittiert. 
Befindet sich die PAE im Zustand „unkonfiguriert^\ wird das KW 
nicht akzeptiert, es wird durch REJ (Reject) quittiert. 
GO: Die Datenverarbeitung wird gestartet. GO kann einzeln oder 
zusammen mit CHECK oder DIFFERENTIAL gesendet werden. 
JSAVE: Eine Konfiguration wird mit der Datenverarbeitung 
verkntipft. Sobald der Trigger WAVE eintrifft wird die mit dem 
Flag WAVE gekennzeichnete Konfiguration in die PAE geladen. 
Wird vor Eintreffen der Triggers WAVE konfiguriert, bleiben 
die mit dem WAVE-Flag gekennzeichneten KW bis zum Eintreffen 
des Triggers gespeichert und werden erst mit dem Trigger 
aktiv. Sofern der Trigger WAVE vor den KW mit dem Flag WAVE 
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eintrifft^ wird die Datenverarbeitung bis zum Eintreffen der 
BCW angehalten. 

Mindestens CHECK Oder DIFFERENTIAL m\i& je fiber tragenem KW 
gesetzt sein, CHECK und DIFFERENTIAL sind jedoch nicht 
gleichzeitig erlaubt. CHECK und GO, bzw- DIFFERENTIAL und GO 
sind zuiassig und starten die Datenverarbeitung. 

Zusatzlich ist ein Flag inplementiert, das keinem KW 
zugeordnet ist und von der CT explizit gesetzt wird: 
LOCK: Eine PAE kann nicht beliebig in den Zustand „not 
configured'' wechseln. Ware dies der Fall, kannte 
beispielsweise die Zelle noch konfiguriert und mit der 
Verarbeitung von Daten befafit sein, w^hrend versucht wird, 
eine erste Konfiguration aus dem FILMO-Speicher in die Zelle 
zu schreiben; dann beendet die Zelle wdhrend des weiteren 
FILMO-Durchlaufes ihre Tfttigkeit. Prinzipiell, d.h. ohne 
welter e M2\finahmen, kdnnte daher eine im FILMO nachfolgende 
gespeicherte zweite Konfiguration, die eigentlich erst nach 
der ersten ausgefvihrt ewrden "darf , diese ZElle belegen. Dies 
kann dann zu DEADLOCK-Situationne fuhren. Indem der Wechsel 
der Konfigurierbarkeit dieser Zelle durch den BEfehl LOCK 
zeitweilig beschrankt wird, kann ein solcher DEadlock 
venaieden werden, Indme die Zelle daran gehindert wird, zu 
einem ungewollten Zeitpunkt konfigurierbar zu werden* Dieses 
Locken der Zelle gegen Umkonfiguration kann insbsondere 
entweder erfolgen, wenn der FILMO duchlaufen wird, und zwar 
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unabhcigig davon, ob es sich urn eine Zelle handelt, auf die zum 
Zwecke der Umkonfiguration tatsSchlich zugegriffen wird. 
Alternativ kann das Locken der Zelle gegen Umkonf igurierung 
erfolgen, indem etwa beim ersten, erfolglosen Zugrif f auf die 
Zelle duch eine im Filmo liegende erste Konfiguration der 
Zelle verboten wird/ sich eine bestimmte Phase lang 
umzukonfigurieren, was das Einkonfigurieren der zweiten 
Konfiguration nur bei jenene Zellen verhindert^ auf die mit 
einer frUhreren Konfiguration zugegriffen werden soil. 

Nach dem FILMO-Prinzip ist ein Wechsel also nur wahrend 
bestimmter ZustSnde im FILMO zulSLssig. Durch LOCK wie 
diskutiert steuert die FILMO Zustandsmaschine den Ubergang in 
den Zustand „not configured^\ 

Je nach Implementierung tibermittelt die PAB ihren aktuellen 
Zustand an eine tibergeordnete Steuereinheit (z.B. die 
zugeordnete CT), oder speichert diesen lokal. 

Obergangstabellen 

Die einfachste Realisierung einer Zustandsmaschine zur 
Einhaltung des FILMO Protokolles ist ohne die Verwendung von 
WAVE und CHECK/ DIFFERENTIAL mOglich- Dabei ist lediglich das 
GO-Flag implementiert, eine Konfiguration besteht aus KW, die 
zusammen mit GO Obertragen werden. Folgende Zustande konnen 
implementiert sein: 

not conflgused: Die PAE verhait sich vollkommen neutral, d.h. 
nimmt keine Daten oder Trigger an und sendet auch keine Daten 
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Oder Trigger. Eine Konfiguration wird erwartet. Diff erentielle 
Konfigurationen, falls iraplementiert, warden zuriickgewiesen. 
configured: Die PAE ist konfiguriert und verarbeitet Daten und 
Trigger. Weitere Konfigurationen werden zurtickgewiesen, 
differentielle Konfigurationen, falls implementiert, werden 
akzeptiert. 

irait for lock: Die PAE erhielt eine Aufforderung zur 
Re konfiguration (z.B. durch Local Reset oder setzen eines Bits 
in einem Konfigurationsregister) . Die Datenverarbeitung ist 
eingestellt, die PAE erwartet die Aufhebung des LOCK, urn den 
Zustand nach ,,not configured^^ wechseln zu kOnnen. 



aktueller PAE Zustand 


Ereignis 


nSchster Zustand 


not configured 


GO-Flag 


Configured 


configured 


Local 
Reset- 
Trigger 


wait for lock 


wait for lock 


LOCK-Flag 


not configured 



Eine vervollstandigte Zustandsmaschine gem£LB dem beschriebenen 
Verfahren ermdglicht die Konfiguration einer PAE, die mehrere 
KWs bendtigt. Dies ist z.B. dann der Fall, wenn eine 
Konfiguration tibertragen werden soli, die auf mehrere 
Konstante Bezug nimmt und diese Konstanten nach bzw. mit der 
eigentlichen Einkonfigurierung auch in die PAE geschrieben 
ewrden sollen. Dazu ist ein weiterer Zustand erf orderlich - 

allocated: Die PAE wurde durch CHECK geprUft und war zur 
Konfiguration bereit. Im Zustand allocated verarbeitet die PAE 
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noch keine Daten. Weitere mit DIFFERENTIAL gekennzeichnete KW 
werden akzeptiert. Mit CHECK gekennzeichnete KW werden 
zurtickgewiesen . 

Nachfolgend ist die entsprechende Obergangstabelle abgebildet, 
WAVE ist noch nicht implementiert: 



aktueller PAE Zustand 


Ereignis 


n^chster Zustand 


not configured 


CHECK- 
Flag 


allocated 


not configured 


GO-Flag 


configured 


allocated 


GO~Flag 


configured 


configured 


Local 
Reset- 
Trigger 


wait for lock 


wait for lock 


LOCK-Flag 


not configured 



4.2.1 Itelemeatienmg von GO 

GO wird 

entweder sofort bei der Konfiguration einer PAE zusammen mit 
dem KW gesetzt, lam die Datenverarbeitung sofort zu starten, 

Oder nach Abschlufi der gesamten SubConf an die jeweillgen FhEs 
gesendet . 

Das Flag GO kann unterschiedlich implementiert sein: 
a) Register 

Jede PAE besitzt ein Register, das zum Start der Verarbeitung 
gesetzt wird. Die technische Realisierung ist vergleichsweise 
einfach, jedoch ist fiir jede PAE ein Konfigurationszyklus 
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erforderlich. GO wird als Flag gemSft der vorherigen 
Beschrelbung zusamznen mlt dem tlbertragen. 
Far den Fall, dali die Reihenfolge, in der PAEs verschiedener 
PACs, die zu einer EnhSxibConf geh6ren, konfiguriert werden, 
nicht unerheblich ist, wird zur Sicherstellung der Einhaltung 
dieser zeitlichen Abh^ngigkeit ein weiteres Verfahren 
vorgeschlagen. Da bei mehreren PACs definitionsgemelfi auch 
mehrere CTs existieren, verstandigen sich diese untereinander, 
um die Infoinaation auszutauschen, ob bisher alle PAEs, die vor 
den in jeder PAC nachsten konfiguriert sein mtissen, bereits 
ihr GO aus derselben Konf iguration akzeptiert haben. 

Eine M6glichkeit, die zeitlichen Abh^ngigkeiten auf zul5sen und 
das Senden von nicht erlaubten GOs zu verhindern, ist, die BCW 
so umzuordnen, da5 eine korrekte Reihenfolge durch die Abfolge 
ihrer Konfiguration durch den FILMO sichergestellt wird. Der 
FILMO merkt sich dann, evtl. durch ein Flag, fQr jede 
Konfiguration, ob bisher alle GOs der aktuellen Konfiguration 
akzeptiert wurden. 1st dies nicht der Fall, werden weitere GOs 
dieser Konfiguration nicht mehr geschickt. Der Initialzustand 
bei jeder neuen Konfiguration ist dabei so, als wenn bisher 
alle GOs akzeptiert wurden. 

Um die Wahrscheinlichkeit, dafl einige PAEs bei der 
Konfiguration bereits nicht mehr konfiguriert sind, zu 
erhOhen, kann man die KH einer zumindest teilweise 
sequentiellen Konfiguration so umsortieren,. dafi KW der 
betreffenden PAEs zeitlich spater konfiguriert werden. Ebenso 
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kann man, wenn dies erforderlich ist, bestimmte PAEs frOher 
aktivieren, indexa man KW der betreffenden Konf iguration so 
umordnet, dai^ die betreffenden PAEs zeitlich frtiher 
konfiguriert werden. Diese Verfahren sind Insbesondere 
anwendbar, wenn die Reihenfolge der KW nicht durch zeitliche 
Abhdngigkeiten, welche auch nach der IMsortierung eingehalten 
werden mtissen, bereits vollst^ndig festgelegt ist. 



b) Verdrahtung mittels Leitung 

Ebenso wie zur Verwendung des LocalReset Signal werden PAEs zu 
Gruppen zusaxnmengef ai^t, die gemeinsam gestartet werden sollen. 
Innerhalb dieser Gruppe werden alle PAEs mit einer Leitung zur 
Verteilung von GO verbunden. Sofern eine Gruppe gestartet 
werden soil, wird einer ersten PAE GO signalisiert, was durch 
Senden eines Signals oder Setzen eines Registers . (siehe a)) 
dieser ersten PAE realisiert wird. Von dieser PAE aus wird GO 
an alle anderen PAE^ weitergeleitet. Zum Starten ist ein 
Konfigurationszyklus erforderlich. Fttr die Weiter leitung wird 
zur Oberbrtlckung grOBerer Distanzen eine Latenzzeit benOtigt. 

c) Broadcast 

Eine Abwandlung von a) und b) bietet eine hohe Perfomance (nur 
ein Konfigurationszyklus) bei vergleichsweise geringem 
Aufwand. 

Dazu erhalten alle Module eine ModulID, die gewOhnlicherweise 
ungleich der SubConfID ist. 

Dabei ist die Gr56e der ModulID mOglichst klein zu halten, 
nach Mdglichkeit sollte eine Breite von einigen wenigen Bits 
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(3-5) ausreichen. Die Verwendung von ModulID wird nachfolgende 
ausfohrlich beschrieben. 

In jede PAE wird wahrend der Konfiguration die entsprechende 
ModulID geschrieben. 

GO wird danach mittels eines Broadcasts gestartet, indem die 
ModulID zusammen mit dem GO-Befehl in das Array gesendet wird. 
Der Befehl wird von alien PAEs enqpfangen, jedoch nur von den 
PAEs mit der passenden ModulID ausgefOhrt. 

4,2,2 Slchem des PAE-Zuatandes 

Der Zustand einer PAE darf sich nicht innerhalb einer 
Konfiguration oder eines FILMO Durchlaufes von ,.konfiguriert** 
auf „unkonfiguriert** Sndern. Belspiel: Zwei verschiedene 
SubConf [Ar D) teilen dieselben Ressourcen, insbesondere eine 
PAE X. Im FILMO liegt SubConf A zeitlich vor SubConf D. Somit 
muB SubConf A die Resourcen vor SubConf D belegen. PAE X ist 
zum Konfigurationszeitpunkt von SubConf A ,,konfiguriert**, 
wechselt vor der Konfiguration von SubConf D aber den Zustand 
auf ,,unkonfiguriert'*. Daraus entsteht eine Deadlock Situation, 
da nunmehr SubConf A PAE X nicht mehr konf igurieren kann, 
SubConf D aber die restlichen Resourcen, die bereits von 
SubConf A belegt sind nicht mehr konf igurieren kann. Weder 
SubConf A noch SubConf D kOnnen ausgeftthrt werden. 
Durch LOCK wird wie erw^hnt sichergestellt, daB sich der 
Zustand einer PAE wShrend eines FILMO Durchlaufes nicht 
unerlaubt andert. Dabei ist es fUr das FILMO-Prinzip 
unbedeutend, wie die Zustandssicherung durchgefUhrt wird, 
dennoch sollen mehrere MCglichkeiten diskutiert werden: 
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LOCK Grundprinzip 

Vor Beginn der ersten Konfiguration und bei jedem neuen 
Durchlauf des FILMOs wird der Status der PAEs gesichert bzw. 
eingerastet. Nach Beendigung jedes Durchlauf es wird der Status 
wieder freigegeben. Bestiminte StatusSnderungen werden also nur 
einmal pro Durchlauf erlaubt. 
Expliziter LOCK 

Das Lock-Signal wird erst nach dem ersten RE J aus dem PA seit 
Beginn eines FILMO-Durchlaufs gesetzt. Dies ist mOglich, da 
zuvor alle PAEs konfiguriert werden konnten und damit bereits 
im Zustand ,,unkonfiguriert^' waren. Nur eine PAE, die ein RE J 
generiert, kOnnte wShrend des weiteren FILMO-Durchlaufes ihren 
Zustand von „configured'^ auf „not configured*' todern. Erst ab 
diesem Zeitpunkt k6nnte ein Deadlock auftreten, ntolich wenn 
ein erstes KW einen REJ erhielt und ein zeitlich sp^teres 
konfiguriert wird. Durch das sofortige Setzen von LOCK nach 
einem REJ wird der Obergang von ,/Configured'" nach „not 
configured** aber sofort verhindert. Der wesentliche Vorteil 
dieses Verfahrens ist, dafl wahrend der ersten Durchlauf phase 
PAEs ihre Zustfinde noch verandern kOnnen, das heiBt 
insbesondere, in den Zustand ,,unkonfiguriert** wechseln dUrfen. 
Wechselt eine PAS also wShrend eines Durchlaufs vor einem 
fehlgeschlagenen Konfigurationsversuch von ^configured** nach 
„not configured** kann diese in derselben Konflgurationsphase 
konfiguriert werden. 
Impliziter LOCK 

Eine noch effizientere Erweiterung des expliziten LOCKs ist 
die implizite Handhabung von LOCK innerhalb einer PAE. 
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Generell sind nur PAEs von der Bedingung der Statussicherung 
betrof fen, die eine Konf iguration zurtickgewiesen haben (REJ) . 
Daher ist es hinreichend wShrend eines FILMO-Durchlaufes den 
Status nur innerhalb der PAEs zu sichern/ die ein REJ 
generierten. Alle anderen PAEs bleiben davon unbertihrt. LOCK 
wird dabei nicht mehr von einer Obergeordneten Instanz (CT) 
generiert. Vielmehr wird nach einem FILMO Durchlauf durch ein 
Signal FREE die Statussicherung in den betroffenden PAEs 
wieder aufgehoben. FREE kann direkt nach einem FILMO-Durchlauf 
an alle PAEs gebroadcastet werden und kann auch gepipelinet 
durch das Array geleitet werden. 

Erweiterte Ober gangs tabellen ftir implizites LOCK; 
Eine von einer PAE generierte ZurUckweisung (REJ) wird lokal 
in jeder PAE gespeichert (REJD = rejected) . Erst bei Rtlckkehr 
nach //not configured** wird die Information gelttscht. 



aktueller PAE Zustand 


Ereighis 


nachster Zustand 


not configured 


CHECK-Flag 


Allocated 


not configured 


GO-Flag 


Configured 


allocated 


GO-Flag 


Configured 


configured 


Local Reset- 
Trigger & 
Zur{lckweisung 
(REJD) 


wait for free 
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configured 


Local Reset- 
Trigger & 
keine 

Zurtlckweisung 
(not REJD) 


not configured 


wait for free 


FREE-Flag 


not configured 



Die Obergangstabellen sind beispielhaft. Eine reale 
Implementierung ist von der jevfeiligen Ausgestaltung abhangig. 



4.2.3 Konfiqnra1:ion einer PAS 

In diesem 2\bschnitt soil der Konfigurationsablauf aus Sicht 
der CT nochmals dargestellt werden. Als PAE gelten dabei auch 
Telle einer PAEr wenn diese unabhangig voneinander die zuvor 
beschroiebenen ZustSnde verwalten. 

Sofern eine PAE neu konfiguriert wird, muB das erste KW das 
Flag CHECK setzen, urn den Status der PAE zu prdfen. Eine 
Konf iguration ftlr eine PAE ist derart aufgebaut, daB 
entweder nur ein KW konfiguriert wird 



CHECK 


DIFFERENTi;^ 


GO 


KW 


X 






KWO 



Oder mehrere KW konfiguriert werden, wobei beim Ersten CHECK 
gesetzt ist und bei alien Weiteren DIFFERENTIAL p 



CHECK 


DIFFERENTIAL 


GO 


KW 


X 






KWO 




X 




KWl 




X 




KW2 




X 




KWn 
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(X) gesetzt, (-) nicht gesetzt, GO ist jeweils optional (*) . 

Sofern CHECK zurtickgewiesen wird (REJ) wird kein nachfolgendes 
ECW mit DIFFERENTIAL Flag an die PAE gesendet. Nach 
akzeptierteia CHECK (ACK) , werden alle weiteren CHECKS bis zur 
Rtickkehr auf den Status ^^not configured^^ zurtickgewiesen , die 
PAE ist far die akzeptierte SubConf alloziiert, Innerhalb 
dieser SubConf werden die n^lchsten KW ausschlieBlich mit 
DIFFERENTIAL konf iguriert . Dies ist zulassig, da durch CHECK 
bekannt istr daB diese SubConf Zugriffsrechte auf die PAE 
besitzt. 



4.2.4 Rucksetzon in den Status „not eon£i<mred^ 
Durch einen besonders ausgestalteten Trigger (LocalReset) wird 
ein Signal propagiert, das das lokale ZurtLcksetzen des 
Zustandes „c6nfigured^* nach ,,not configured" in den 
einpfangenden PAEs auslttst^ spates tens nach einem empfangenen 
LOCK Oder FREE. Das ZurUcksetzen kann zusatzlich noch durch 
andere Quellen ausgel5st werden, beispielsweise durch ein 
Konfigurationsregister. 

LocalReset kann von der Quelle, die das Signal generiert (iber 
alle bestehenden konfigurierbaren Busverbindungen, d.h. 
s^tliche Triggerbusse und samtliche Datenbusse, an jede tlber 
die Busse angeschlossenen PAEs weitergeleitet werden. 
Grundsatzlich leitet dabei z.B. jede LocalReset empfangende 
PAE das Signal wiederum Ober alle angeschlossenen Busse 
weiter. 
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Urn jedoch eine Weiterleitung von LocalReset uber die Grenze 
einer lokalen Gruppe hinaus zu verhindern, ist unabhSngig far 
jede Zelle konf igurierbar, ob und tlber welche angeschlossenen 
Basse das LocalReset weitergeleitet warden soil. 

4.2.4.1 lioschen nicht veils ttodig konfiguriertar SobConf 

In einigen Fallen kann es vorkommen, dafi mit der Konfiguration 
einer SubConf begonnen wird und wShrend der Konfiguration 
festgestellt wird, daB die SubConf entweder nicht (mehr) oder 
nicht vollstandig benOtigt wird. LocalReset andert unter 
Umstanden nicht den Zustand aller PAEs auf „unkonfiguriert^\ 
da der Bus noch nicht komplett aufgebaut wurde. 
Zwei MOglichkeiten werden erf indungsgemaB zur LOsung 
vorgeschlagen. Bei beiden Verfahren sendet die PAE, die das 
LocalReset generiert hatte, einen Trigger an die CT. Die CT 
informiert daraufhin die PAEs wie folgt: 

4.2.4.2 Bei Vorwendpng von ModnllD 

Sofern eine MOglichkeit zur Speicherung der ModulID innerhalb 
jeder PAE vorgesehen isti kann mittels elnes einfachen 
Broadcasts, bei dem die Identifikation mitgesendet wird, jede 
PAE mit dieser bestimraten Identifikation aufgefordert werden, 
in den Zustand ,,not configured'" zu gehen. 

4.2.4.3 Bei Verwendtinq des GO-Sicpiales 

Sofern eine GO-Leitung in exakt der Reihenfolge verdrahtet 
wird, wie PAEs konfiguriert werden, ist es m5glich der GO^ 
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Leitung eine Reset-Leitung zuzuordnen, die samtliche PAEs in 
den Zustand ,,not configured'' setzt. 

4«2«4.4 EKPligites Reset darch Konfiqiaratxonsreqxster 

In jeder PAE wird ein Bit oder ein Code innerhalb der 
Konfigurationsregister definiert, wobei durch Setzen dieses 
Bits Oder Codes durch die CT die PAE in den Zustand „not 
configured*' zuruckgesetzt wird. 

4.3 Hal ten der Paten in den PABs 

Besonders vorteilhagft ist bei Bausteinen der 
erfindungsgeiocLBen Gattung ist, wenn Daten und Zustclnde einer 
PAE (iber eine Rekonfiguration hinweg gehalten werden konnen. 
Mit anderen Worten^ ist es mCglich innerhalb einer PAE 
gespeicherte Daten trotz Rekonfiguration zu erhalten. Durch 
entsprechende Angaben in den KKF wird dazu ftir jedes relevante 
Register definiert ob es durch die Rekonfiguration 
zurflckgesetzt wird. 
Beispiel : 

Ist ein Bit innerhalb eines KW zum Beispiel logisch 0 wird der 
aktuelle Registerwert des zugeordneten Daten- oder 
Zustandsregisters beibehalten, eine logische 1 setzt den Wert 
des Registers zurtick. Ein entsprechendes KW kOnnte 
folgendermassen strukturiert sein: 



Eingangsregister 


Ausgangsregister 


Zustandsflags 


A 


B 


C 


H 


L 


equal/ 
zero 


overflow 



Dadurch ist bei jeder Rekonfiguration der Datenerhalt wShlbar. 
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4.4 Setzen von Paten xn den PABs 

Weiterhin ist es raoglich Daten bei Rekonf iguration von der CT 
in die Register der PAEs zu schreiben. Dabei sind die 
relevanten Register durch KWs adressierbar* Bin besonderes Bit 
zeigt an, ob die Daten als Konstante Oder als Datenwort 
behandelt werden. 

• Eine Konstante bleibt bestehen, bis sie neu gesetzt wird* 

• Ein Datenwort ist fttr genau eine bestiinzate Anzahl von 
Verrechnungen, z.B. genau eine Verrechnung gttltig. Nach 
Verarbeitung des Datenwortes existiert das von der CT in- 
das Register geschriebene Datenwort nicht mehr. 

5> Erweiterangen 

Das Busprotokoll kann derart erweitert werden, daB die KWs 
und ACK/EIEJ Signale auch tlber Register gepipelinet werden 
kOnnen. 

Dies ist besonders vorteilhaft und wird ftir sich Oder in 
Verbindung mit anderem als patentfelhig angesehen. 

In jedem Takt soil ein Oder mehrere KWs gesendet werden 
k6nnen. Das FILMO-Prinzip soli eingehalten werden. Das 
Grundprinzip sieht vor, eine Zuordnung zu einem in das PA 
geschriebene KW derart aufzubauen, daJi die zeitlich verzOgerte 
Quittierung nachtrdglich dem KW zugeordnet wird. Von der 
Quittierung abhcLngige BCW werden derart umsortiert, daift sie 
erst nach Eintreffen der Quittierung verarbeitet werden. 
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Die nachfolgend beschriebenen alternativen Verfahren erfiillen 
die Anforderungen, wobei die Verfahren unterschiedliche 
Vorteile aufweisen: 

5.1 Looltttp-Tabellen (SgATEUTP) 

Jede PAE sendet ihren Status an eine Lookup Tabelle (STATELUT) 
die lokal in der CT implementiert ist. Die CT prttft beim 
Versenden eines KW den Zustand der adressierten PAE durch 
einen Lookup in der STATELUT. Die Quittierung (ACK/REJ) wird 
von der STATELUT generiert. 

Im Detail funktioniert das Verfahren wie folgt: 

In einer CT wird der Zustand jeder einzelnen PAE in einem 
Speicher oder Registersatz verwaltet. Flir Jede PAE existiert 
ein Eintrag, der anzeigt in welchem Modus (^konfiguriert'', 
^unkonfiguriert"') sich die PAE befindet. Anhand des Eintrages 
prttft die CT, ob die PAE umkonfiguriert werden kann. Der 
Zustand wird von der CT intern, also ohne Nachfrage bei den 
PAEs geprttft. Jede PAE sendet ihren Status je nach 
Implement ierung selbstandig oder nach Aufforderung an die CT- 
interne STATELUT. Bei gesetztem LOCK bzw. fehlendem FREE 
werden keine StatusSnderungen von den PAEs an die STATELUT 
gesendet, bzw. von der STATELUT ttbernoramen. 

Durch einen einfachen Mechanismus wird der Zustand der PAEs 
tiberwacht, wobei die bereits beschriebenen Mechanismen der 
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Zustandssteuerung und die bekannten Zustande realisiert 
warden: 

Setzen des Zustands /^onf iguriert^^ 

Beim Schreiben einer mit deia Flag CHECK versehenen KW erfolgt 
eine PrGfung der adressierten PAE in der STATELDT. 

o Sofern die PAE in einem umkonfigurierbaren Status ist, 
wird die PAE als ^allocated** in der STATELDT vermerkt. 
o Sobald die PAE gestartet wird (GO) wird die PAE als 
reconfigured'* eingetragen. 

Racksetzen des Zustandes ,,konf iqurierf auf ,,unkonfiquriert** 
Mehrere Methoden kOnnen je nach Applikation und 
In^)leinentierung verwendet werden: 

a) Jede PAE sendet ein Statussignal an die Tabelle, wenn sich 
ihr Zustand von "konfiguriert" auf "unkonfiguriert" andert. 
Dieses Statussignal kann gepipelined gesendet werden. 

b) Ein Statussignal (LocalReset) wird ftir eine Gruppe von PAEs 
gesendet, das anzeigt, dal^ sich der Zustand fUr die gesamte 
Gruppe von "konfiguriert" auf "unkonf iguriert" ge^ndert hat. 
Ober eine Liste werden stotliche PAEs die zur Gruppe gehttren 
ausgewahlt und der Zustand ftir jede einzelne PAE in der 
Tabelle geandert. Wesentlich ist, daB das Statussignal von 
der letzten per LocalReset entferntem PAE einer Gruppe an 
die CT gesendet wird, Ansonsten kann es zu Inkonsistenzen 
zwischen der STATELUT und dem tatsSchlichen Zustand der PAEs 
kommen, indem die STATELUT eine PAE als ^unkonfiguriert*" 
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ausweist, die sich tatsachlich jedoch noch im Zustand 
^^konfiguriert'^ befindet. 

c) Nach Eintreffen eines LOCK-SignalSr das vorzugswelse 
gepipelinet wird/ sendet jede PAB, deren Status sich seit 
dem letzten Eintreffen von LOCK geSlndert hat, ihren Status 
an die STAXELUT. LOCK erhSlt dabei eher die Semantik 
^TRANSFER STATUS^^. Da PAEs ihren Status jedoch nur nach 
dieser Aufforderung tibertragen und die StatusMnderung 
ansonsten geLOCKed ist, bleibt das Verfahren bis auf die 
umgekehrte Semantik dasselbe* 

Zur Oberprtifung des Zustandes einer PAE bei der Konf iguration 
wird beim Absenden der Adresse der Ziel-PAE eines KW die 
STATELDT abgefragt und dementsprechend ein ACK Oder REJ 
generiert* Ein KW wird nur dann an eine PAE gesendet, wenn 
kein REJ generiert wurde Oder wenn das DIFFERENTIAL Flag 
gesetzt ist. 

Durch dieses Verfahren ist die zeitliche Reihenfolge der KW 
sichergestellt . Nur gtiltige KW werden zu den PAEs gesendet. 
Nachteilig ist der Aufwand der Implementierung der STATELUT 
sowie die RUcksendung der PAE-Zustande an die STATELUT und die 
dazu erforderliche Busbandbreite und Laufzeit. 

5,2 Dtosortiaren der KW 
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Wesentlich ftir die Anwendung des nachfolgenden Verfahrens ist 
die Verwendung des CHECK-Flags fUr jedes erste an eine PAE 
gesendete KW (KWl) • 

Die SubConf wird wie folgt umsortiert: 

1. Zuerst wird KWl einer ersten PAE beschrieben. In der Zeit 
(DELAY) bis zum Eintreffen der Quittung (ACK/REJ) folgen 
exakt so viele Leerzyklen (NOPs)/ wie Takte vergehen. 

2. Danach wird das KWl einer zweiten PAE beschrieben. 
wahrend DELAY kannen die restlichen KW der ersten PAE 
beschrieben werden. Eventuell restliche verbleibenden 
Takte werden mit Leerzyklen aufgefttllt. Der 
Konfigurationsblock von KWl bis zum Ablauf von DELAY wird 
Atom genannt. 

3. Bei jeder weiteren PAE wird ebenso verfahren. 

4 . Werden bei einer PAE mehr KW beschrieben als Takte 
wahrend DELAY anstehen, wird der verbleibende Teil auf 
die nachfolgenden Atome verteilt. Alternativ kann das 
DELAY auch aktiv veriangert werden, wodurch eine grOBere 
Anzahl von KW im selben Atom geschrieben werden k6nnen. 

Bei Eintreffen von ACK far ein KWl werden alle weiteren KW ftir 
die entsprechende PAE konf iguriert, Sofem die PAE mit RE J 
quittiert, wird kein wei teres, die PAE betreffendes, KW 
konfiguriert. 

Das V6rfahren gewahrleistet die Einhaltung der Reihenfolge der 
Konf iguration • 
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Nachteilig ist, daB nicht die optimale 

Konfigurationsgeschwindigkeit erreicht werden kann. Da zur 
Einhaltung der Reihenfolge die Wartezeit eines Atoms 
gegebenenfalls mit Leerzyklen (NOPs) gefailt werden mufi sinkt 
die nutzbare Bandbreite und die Gr5Be einer SubConf ninrnit 
durch die NOPs zu. 

Weiterhin bereitet ein Paradoxon eine nicht l^Ssbare 
Einschrankung der Konfigurationsgeschwindigkeit: 
IM die Menge der Konfigurationsdaten und -zyklen mOglichst 
gering zu halten, sollte die Zahl der Konfigurationsregister 
mOglichst klein gehalten werden. Da bei hdheren Frequenzen 
DELAY zwangsweise grOfier wird, kollidiert dies mit der 
Forderung, DELAY sinnvoll durch das AuffQllen mit KW zu 
nutzen* 

Das Verfahren scheint daher nur bei serieller Obertragung der 
Konfigurationsdaten sinnvoll einsetzbar zu sein. Durch die 
Serlallsierung der ¥Vf ist der Datenstrom ausreichend lang, vm 
die Wartezeit zu fUllen. 

5.3 Auswerten der ACK/BEJ Qaifctienipg nit l»atency 
( CHECKRCKRE J) 

Das CHECK-Signal wird mit den KW Ober eine oder mehrere 
Pipeline-Stufen an die adressierte PAE gesendet. Die 
adressierte PAE quittiert (ACK/REJ) ebenfalls gepipelinet an 
die CT. 
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In jedem Takt wird ein KW abgesendet, dessen Quittung 
(ACK/REJ) erst n-Takte spater bei der CT ankommt und 
ausgewertet wird. WMhrend dieser Zeit werden jedoch n weitere 
KWs gesendet, Daraus ergeben sich zwei Problemebereiche : 

• Steuerung des FILMOs 

• Einhaltung der Reihenfolge der KWs 

5,3,1 Stenening des BTIMOa 

Innerhalb des FILMO mufl vemerkt werden, welche iCW von einer 
P2VE akzeptiert wurde (ACK) und welche zuruckgewiesen wurden 
(REJ) . Die zurtickgewiesenen KW werden in einem spateren FILMO 
Durchlauf erneut gesendet. Bei diesem spateren Durchlauf ist 
es aus GrQnden der Konfigurationseffizienz sinnvoll, nur die 
KWs zu durchlauf en, die zurtlckgewiesen wurden. 
Die beschriebenen Anforderungen sind wie folgt realisierbar: 
Dem FILMO wird ein weiterer Speicher (RELJMP) zugeordnet, der 
dieselbe Tiefe wie der FILMO aufweist. Ein erster Z^hler 
(ADR_CNT) zeigt auf die Adresse des KW im FILMO, das aktuell 
in das PAE-Array geschrieben wird, Ein zweiter zahler 
(ACK/REJ_CNT) zeigt auf die Position des KW im FILMO, dessen 
Quittung (ACK/REJ) aktuell aus dem Array zurackkommt . Ein 
Register (LASTREJ) speichert den Wert von ACK/RBJ_CNT, der auf 
die Adresse des letzten KW zeigt, dessen Konfiguration mit REJ 
quittiert wurde. Ein Subtrahierer errechnet die Differenz 
zwischen ACK/REJ_CNT und LASTREJ. Beim Auftreten eines REJ 
wird diese Differenz in die Speicherstelle mit der Adresse 
LASTREJ im Speicher RELJMP geschrieben. 
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RELJMP enthait somit die relative Sprungweite zwischen einem 
zurtlckgewiesenen KW und dessen Nachfolger. 

1. Jedem akzeptierten KW ist ein RELJMP-Eintrag ,,0'' (null) 
zugewiesen. 

2. Jedem zurtlckgewiesenen ECW ist ein RELJMP-Eintrag ,,>0^* 
(grOfier null) zugewiesen. Durch Addition der aktuellen 
Adresse mit dem RELJMP-Eintrag wird die Adresse des 
ndchsten zurtickgewiesenen KWs im FILMO berechnet. 

3. Dem letzten zurtickgewiesenen KW ist ein RELJMP-Eintrag 
,,0** (null) zugewiesen, wodurch das Ende angezeigt wird. 

Die Speicherstelle der ersten Adresse einer SubConf ist mit 
einem NOP im FILMO belegt. Der zugeordnete RELJMP enthalt den 
relativen Sprung zum ersten abzuarbeitenden KW. 

1. Beim ersten Durchlauf des FILMO ist der Wert „1'' (eins) . 

2. Bei einem folgenden Durchlauf zeigt der Wert auf das 
erste abzuarbeitenden KW, ist also ,,>0^* (grCfier null) . 

3. Sofern alle KWs der SubConf konfiguriert wurden, ist der 
Wert „0^^ (null) . Woran die Zustandsmaschine die 
vollstandig Abarbeitung der Konfiguration feststellt. 

5-3.2 Einhaltung der Re±hen£olqe (BARRIER) 

Bei dem unter 5.3 beschriebenen Verfahren ist es nicht mOglich 
eine bestimmte Konfigurationsreihenfolge zu garantieren. Das 
Verfahren stellt lediglich die FILMO Anforderungen nach 2.1 
a)-c) sicher. 
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In bestimmten Applikationen ist die Einhaltung der 
Konfigurationsreihenfolge innerhalb einer SubConf (2.1 e)), 
sowie die Einhaltung der Konfigurationsreihenfolge der 
einzelnen SubConf selbst, relevant (2.1 d) ) • 
Die Einhaltung von Reihenfolgen wird derart erreicht, dafi 
SubConf in mehrere BlOcke partitioniert werden. Zwischen den 
einzelnen B16cken wird ein Token (BARRIER) eingefQgt, das nur 
tlbersprungen wird, wenn keines der vorhergehenden KW 
zurUckgewiesen (RE J) wurde. 

Trifft die Konfiguration auf eine BARRIER und es traten zuvor 
RE J auf, darf die BARRIER nicht tlbersprungen werden. 
Es wird zwischen wenigstens zwei Arten von BARRIERS 
unt er s chi eden : 

a) NonBlocking: Die Konfiguration wird mit der nachfolgenden 
SubConf fortgeftlhrt. 

b) Blocking: Die Konfiguration wird mit weiteren DurchlSufen 
der aktuellen SubConf fortgeftlhrt- Die BARRIER wird erst 
tlbersprungen, wenn die aktuelle SubConf vollstandig 
konfiguriert wurde. 

(teerlegungen zur Optimierung der Konfigurations- 
geschwindigkeit : 

GewOhnlicherweise ist die Einhaltung der Reihenfolge der 
Konfiguration der einzelnen KW nicht notwendig. Allerdings mufl 
die Reihenfolge der Aktivierung der einzelnen PAEs (GO) exakt 
eingehalten werden. Die Geschwindigkeit der Konfiguration ist 
steigerbar/ indem die KWs derart umsortiert werden, daB 
sitaitliche BCWs bei denen das GO-Flag nicht gesetzt ist, vor die 
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BARRIER gezogen werden. Ebenfalls massen sSmtliche BCW mit 
gesetztem CHECK-Flag vor die BARRIER gezogen werden • Wird eine 
PAE mlt nur einem KWF konf iguriertr muB das ECW in zwei Worte 
aufgespalten werden^ wobei das CHECK-Flag vor der BARRIER 
gesetzt ist und das GO- Flag nach der BARRIER. 

An der BARRIER ist bekannt, ob sfimtliche CHECKS mit ACK 
quittiert wurden. Da eine ZurQckweisung (REJ) nur mit 
gesetztem CHECK-Flag auftritt, werden alle KW hinter der 
BARRIER grundsatzlich in der richtigen Reihenfolge ausgefOhrt. 
Die KW hinter der BARRIER werden exakt nur einmal durchlaufen 
und der Start der einzelnen PAEs verlauft ordentlich. 

5.3,3 Garbage Collector 

FQr das Verfahren gemSB 5.3 bieten sich zwei unterschiedliche 
Implementierungen eines Garbage Collectors (GC) an: 

a) Ein als Algorithmus oder einfache Statemachine 
implementierter GC. Zu Beginn zeigen zwei Zeiger auf die 
Startadresse des FILMOs: Ein erster Zeiger (ReadPointer) zeigt 
auf das aktuelle vom GC zu lesende KW, ein zweiter 

Zeiger (WritePointer) zeigt auf die Position auf die das KW 
geschrieben werden soil. ReadPointer wird linear 
inkrementiert. Jedes KW^ dessen RelJmp unglelch ^0^' (null) 
ist, wird auf die Adresse WritePointer geschrieben. RelJmp 
wird auf „1'^ gesetzt und WritePointer wird inkrementiert. 

b) Der GC wird in den FILMO integriert, indem zu dem 
Auslesezeiger des FILMOs ein WritePointer hinzugefttgt wird. 
Der WritePointer zeigt bei Beginn des FILMO-Durchlaufs auf den 
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ersten Eintrag. Jedes KW, das beim Konfigurieren einer PAE mit 
einem RE J zurackgewiesen wurde, wird auf die Speicherstelle 
geschrieben, auf die WritePointer zeigt. Danach wird 
WritePointer inkrementiert . Bin zusMtzlich FIFO-ahnlicher 
Speicher (z-B. auch ein Schiebregister) ist erforderlich, der 
das an eine PAS gesendeten in der richtigen Reihenfolge 
solange zwischenspeichert, bis das zum KW gehfirende ACK/REJ 
wieder beim FILMO eintrifft, Beixn Eintre££en eines ACK wird 
das KW ignoriert. Beim Eintreffen von RE J wird (wie bereits 
beschrieben) das an die Speicherstelle geschreiben, auf die 
WritePointer zeigt. Der Speicher des FILMO ist dabei 
vorzugsweise als ein Multiport Speicher ausgestaltet. 
Bei diesem Verfahren ergibt sich zum Ende eines jeden FILMO- 
Durchlaufes ein neuer Speicheraufbau, bei welchem die nicht 
konfigurierten KW linear am Beginn des Speichers stehen. 
ZuscLtzliche GC Durchldufe sind nicht notwendig. Ebenfalls kann 
auf die Implementierung von RelJmp und der dazugehOrenden 
Logik vollstandig verzichtet werden. 

5.4 Prefetcfaen der ACK/REJ QalttJ-erang lait Latency 

Abschliefiend soil eine Weiterentwicklung von 5.3 beschrieben 
werden. Nachteil dieses Verfahrens ist die vergleichsweise 
hohe Latenzzeit die der dreifachen Lange der Pipeline 
entspricht . 

Die Adressen und/oder Flags der jeweils zu konfigurierenden 
PAEs werden auf einem getrennten Bussystem vor der 
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eigentlichen Konf iguration abgesendet. Das Timing ist derart 
ausgelegt, daB zum Zeitpunkt des gewollten eigentlichen 
Einschreibens des Konf igurationwortes in eine PAE dessen 
ACK/REJ Information vorliegt. Sofern mit ACK quittiert wurde, 
wird die KONFIGURATION durchgefOhrt; bei einer Zurtickweisung 
(REJ) werden die KW nicht an die PAE gesendet (ACK/REJ- 
PREFETCH) . Durch das FILMO Protokoll, insbesondere das LOCK, 
ist sichergestellt, dafl zwischen ACK/REJ-PREFETCH und der 
KONFIGURATION kein unerlaubter Statuswechsel der PAEs 
stattf indet - 



5.4.1 Aufbau des Fll^a 

Der FILMO funktioniert wie folgt: Die KW werden in korrekter 
Reihenfolge erhalten, entweder (i) aus dem Speicher der CT 
Oder (ii) aus dem FILMO- Speicher. 

Die PAE-Adressen der ausgelesenen KW werden tiber ein erstes 
Bussystem gepipelinet an die PAEs gesendet. Die kompletten KW 
werden in einen FIFO-artigen Speicher mit fester 
VerzGgerungszeit (der beispielsweise auch als Schieberegister 
ausgestaltet sein kann) geschrieben. 

Die jeweils adressierte PAE quittiert abh^ngig von ihrem 
Status durch Senden von ACK oder REJ. Die Tiefe des FIFOs 
entspricht der Anzahl von Takten, die zwischen dem Absenden 
der PAE-Adresse an eine PAE und dem Eingang der Quittung der 
PAE vergehen. Der Zyklus vom Absenden der Adresse an eine PAE 
bis zum Eintreffen der Quittung der PAE wird Prefetch genann. 
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Durch die bestimmte VerzeSgerung im FIFO-artigen Speicher, der 
hier nicht identisch mit dem FILMO ist, trifft die Quittung 
einer PAE exakt zu dem Zeitpunkt bei der CT ein, zu dem auch 
das zu der PAE gehorende KW am Ausgang des FIFOs ansteht. 
Beim Eintreffen von ACK wird das KW an die PAE versendet, eine 
Quittierung wird nicht mehr erwartet. Der PAE Zustand hat sich 
zwischenzeitlich nicht unerlaubt geandert, die Annahme ist 
garantiert. 

Beim Eintreffen von RE J wird das KW nicht an die PAE gesendet, 
sondern zurQck in den FILMO-Speicher geschrieben. Daftir steht 
ein zusatzlicher Zeiger zur Verftigung, der bei Beginn des 
linearen Auslesens des FILMO-Speicher s auf die erste Adresse 
zeigt. Mit jedem zurUckgeschriebenen Wert wird der Zeiger 
inkrementiert. Dadurch werden automatisch die zurUckgewiesenen 
KWs linear gepackt, was einem iiitegrierten Garbage-Kollektor 
Durchlauf entspricht. (siehe auch 5.3)- Diese Implementierung 
ist besonders vorteilhaft und wird far sich genommen als 
schutzfMhig angesehen. 

5.4 >2 Senden mid Quittierea tfcber eine Registerpipeline 

Das hier beschriebene Verfahren dient der Sicherstellung einer 

einheitlichen TaktverzOgerung zwischen gesendeten Mitteilungen 

und empfangenen Antworten darauf , wenn zwischen einem Sender 

und mehreren m5glichen EnpfMngern von Mitteilungen 

unterschiedliche Anzahlen von Registern geschaltet 

sind. Ein Beispiel dafttr ist, wenn En^fanger unterschiedlich 

wait vom Sender entfernt sind. Die gesendete Mitteilung darf 
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dabei naheliegende Empffinger frtlher erreichen als weiter 
entfernte. 

Um eine gleiche Laufzeit far alle Antworten zu erreichen, wird 
die Antwort vom Empfanger nicht direJct zurackgeschickt, 
sondern weiter bis zu einem vom Sender am weitesten entfernten 
Empf anger. Dieser Weg muB dabei genau soviele Register 
aufweisen/ dafl die Antwort zu dem Zeitpunkt ankommt^ an dem 
auch eine mit der ersten Nachricht gleichzeitg abgeschickte an 
diesem Punkt angekoramen ware. Von hier aus erfolgt das 
ZurUckschicken genauso, als wenn die Antwort in diesem 
Empf anger selbst erzeugt wurde. 

Ob die Antwort tatsachlich bis zu einem am weitesten 
entfernten EmpfSnger geschickt wird oder in eine andere Kette 
mit Regis tern, die das gleiche Zeitverhalten hat, ist dabei 
unerheblich- 



6. Hierarchisches CT-Protokoll 

Wie in PACTIO beschrieben, sind VPU-Bausteine skalierbar, 
indem ein Baum aus CTs aufgebaut wird, an dessen Slattern 
jeweils die niedersten CTs (Low-Level-CTs) der PAs angeordnet 
sind. Eine CT mit dem ihr zugeordnetem PA wird PAC genannt. 
Generell kttnnen beliebige Daten oder Befehle zwischen den CTs 
ausgestauscht werden. Hierzu kann zunachst jedes technisch 
sinnvolle Protokoll verwendet werden. 
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Sofern die Koiraaunikation (Inter-CT-Kommunikation) allerdlngs 
das Starten von SiibConf auf verschiedenen Low-Level-CTs 
innerhalb des CT-Baums (CTTREE) bewirktr sollen die 
Anforderungen des FILMO-Prinzips sichergestellt sein, um die 
Deadlock- Freiheit zu gewahrleisten, 
Generell sind zwei Faile zu unterscheiden : 

1. Bei einer Low-Level-CT wird der Start einer SubConf 
angefordert, die ausschlieMich lokal auf der Low-Level- 
CT und dem ihr zugeordneten PA lauft. Dieser Fall kann 
jederzeit innerhalb des CTTREE bearbeitet werden und 
bedarf keiner besonderen Synchronisation mit anderen LOW- 
LEVEL_CTs . 

2. Bei einer Low-Level-CT wird der Start einer Konfiguration 
angefordert/ die auf mehreren Low-Level-CTs und den ihnen 
zugeordneten PAs ISuft. In diesem Fall mufi darauf 
geachtet werden , dafi der Aufruf der Konfiguration auf 
alien beteiligten CTs atomar, also untrennbar verlcLuft. 
Am einfachsten ist es, hinreichend sicherzustellen, da6 
w^hrend des Aufrufes und des Starts einer bestimmten 
SubConf keine andere gestartet wird. Ein derartiges 
Protokoll ist aus PACTIO bekannt. Es ist aber ein noch 
weiter optimiertes Protokoll wttnschenswert. 

Das Protokoll aus PACTIO ist ineffizient, sobald eine 
gepipelinete Obertragung bei hdheren Frequenzen notwendig ist, 
da die Buskommunikation einer groBen Latenzzeit unterliegt. 

In den folgenden Abschnitten wird ein Verfahren ausgeftthrt. 
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Wesentliche Aufgabe der Inter-CT-Kommunikation ist 
sicherzustellen, dafi PAC Obergrelfende SubConf (Enhanced 
SubConflguration = EnhSubConf) deadloclcfrei gestartet werden. 
EnhSubConf sind SubConf die nicht nur auf einer PAC lokal, 
sondern auf mehreren PACs verteilt ausgeftihrt werden. Eine 
EnhSubConf beinhaltet mehrere SubConf, die jeweils liber die 
beteiligten Low-Level-CTs gestartet werden- Als PAC wird dabei 
eine PAE-Gruppe zait wenigstens einer CT verstanden. Um die 
Deadlockfreiheit sicherzustellen, ist folgende Bedingung 
notwendig: 

Damit mehrere EnhSubConf deadlockfrei auf identischen PACs 
laufen kOnnen, wird - zum Bei-spiel innerhalb des CTXREEs - 
durch einen geeigneten Mechanismus eine Priorisierung ihrer 
Ausftlhrung festgelegt. Sofern dabei von mehreren 
unterschiedlichen EnhSubConf aus SubConf gestartet werden 
sollen/ die auf ein und denselben PACs ablaufen, erfolgen auf 
den jeweiligen PACs die Starts dieser SubConf in der 
zeitlichen Reihenfolge entsprechend der Priorisierung der 
EnhSubConf. 

Beispiel: Zwei EnhSubConf sollen gestartet werden, namlich 
EnhSubConf -A auf den PACs 1,3,4,6 und EnhSubConf ~B auf den 
PACs 3,4,5,6. Es muB sichergestellt sein, daB auf den PACs 
3,4,6 immer EnhSubConf -A ausschlieBlich entweder vor Oder nach 
EnhSubConf-B konfiguriert wird. Sollte beispielsweise auf PAC 
3 und 4 EnhSubConf-A vor £nhSubConf-B und auf PAC 6 
EnhSubConf-A nach EnhSubConf-B konfiguriert werden liegt ein 
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Deadlock vor, da EnhSubConf-A nicht auf PAC 6 und EnhSubConf-B 
nicht auf PAC 3 und 4 gestartet werden kdnnte. Bin derartiger 
Fall wird im weiteren Kreuz oder gekreuzt genannt. 

Es ist ausreichend zu verhindern, daB sich EnhSubConf kreuzen. 
Sollte eine algorithmische AbhSngigkeit zwischen zwei 
EnhSubConf bestehen, also dafi aufgrtand des Algorithmus eine 
EnhSubConf nach der anderen gestartet werden mufi, wird dies 
normalerweise dadurch aufgelost, dafi eine EnhSubConf die 
andere startet. 



AusfOhrungsbeispiel fOr das erfindunggemafie Protokoll: 
Die Inter-CT-Kommunikation unterscheidet zwlschen zwei 
Datenarten: 

a) einer SubConf, die die Konfigurationsinf ormation enthait, 

b) einer IDChain, die eine Liste aus zu startenden IDs 
enthait; zusammen mit der Angabe, auf welchem PAC die 
durch die ID referenzierte SubConf gestartet werden soil. 
Durch eine IDChain wird eine EnhSubConf auf die einzelnen 
auszufOhrenden SubConf tlbersetzt: iPsnhsubconf 

IDChain {(PACi : IDs^bcoiifi) , ( PACa : lOsubconfa) , ( PAC3 : 

IDsubConfs)/ ... (PACn : IDsubconfix) } 

Die Inter-CT-Kommunikation unterscheidet zwischen folgenden 
Obertragungsmodi : 

BBQDBST: Der Start einer EnhSubConf wird von einer Low-Level- 
CT, bei der ihr ttbergeordneten CT angefordert - oder von einer 
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tibergeordneten CT bei der ihr wiederum Obergeordneten 
angefordert. Dies wiederholt sich so lange, bis entweder eine 
CT erreicht ist, die die IDChain gespeichert hat, oder die 
RootCT erreicht ist, die die IDChain iiamer im Speicher hat. 
GRAHT: Eine Qbergeordnete CT beauftragt eine tieferliegende CT 
mit dem Start einer SubConf , Entweder handelt es sich um eine 
einzelne SubConf Oder mehrere SubConf gemaB der IDChain* 
GET: Eine CT fordert bei der ihr tibergeordneten CT eine 
SubConf durch Senden der entsprechenden ID an. Sofern die 
Qbergeordnete CT die SubConf gespeichert (gecached) hat, 
sendet sie diese an die tiefere CT, ansonsten fordert sie 
wiederum bei der ihr tibergeordneten die SubConf an und sendet 
diese an die Tiefere nach Erhalt. SpStestens die RootCT hat 
die SubConf gespeichert • 

DOHam^QAD: Das Laden einer SubConf auf eine tiefergelegene CT. 

REQUEST lauft so lange den CTTREE hoch, bis entweder die 
RootCT, das heil^t die Wurzel (die hCchste CT) im CTTREE, 
erreicht ist, oder eine CT im CTTREE die IDChain gespeichert 
hat. Die IDChain kann nur von einer CT gespeichert werden, die 
samtliche in der Liste der IDChain beeinhalteten CTs, als 
Blatter Oder Zweige besitzt. Die RootCT hat in ihrem Speicher 
(CTR, vgl, PACTIO) grundsStzlich Zugriff auf die IDChain. 
Danach wird GRANT an alle in der IDChain aufgelisteten CTs 
gesendet- Das Senden von GRANT geschieht atomar, d.h. alle 
Zweige einer CT erhalt en GRANT entweder gleichzeitig oder 
sequentiell, jedoch ohne Onterbrechung durch eine andere 
Aktivitat zwischen einer der betreffenden CTs und irgend einer 
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anderezi, die die Reihenfolge der Starts der SubConf 
verschiedener EnhSubConf auf den PACs beeinfluBt. 
Wichtig 1st, daB eine Low-Level-CT, bei der GRANT eintrifft/ 
sofort und unterbrechungsfrei die entsprechende SubConf in das 
PA konfiguriertr in den FILMO schreibt Oder in eine Liste 
schreibt, aus der die Konf igurationsreihenfolge hervorgeht, 
das heiBt^ wann genau die SubConf auf den FILMO geschrieben 
bzw. in das PA konfiguriert werden muB. Die Reihenfolge ist 
wesentlich, um einen Deadlock zu vermeiden. Sofern die SubConf 
nicht bereits in der Low-Level-CT gespelchert ist, muB die 
Low-Level-CT die SubConf mittels GET bei der ihr 
tUbergeordneten CT anfordern. Urn dem erfindimgsgemctfien 
Verfahren zu gentigen, dtirfen zwischen GET und dem Eintref fen 
der SxibKonf (DOWNLOAD)^ sofern es der Algorithmus zuiafit Oder 
er f order t, lokale SubConf {d.h. SubConf die nicht von einer 
EnhSubConf aufgerufen werden sondern nur das lokale PA 
betreffen) konfiguriert oder in den FILMO geladen werden. 
SubConf elner weiteren EnhSubConf, die von einem spdteren 
eintreffenden GRANT gestartet Werden, dOrfen ausschlieBlich 
nach dem Eintref fen von DOWNLOAD, sowie der Konfiguration bzw. 
dem Laden in den FILMO gestartet werden. 

Beispiele ftir den Aufbau von SubConf sind aus den 
Patentanmeldungen PACT05 und PACTIO bekannt. Ein wesentlicher 
Unterscheid des erf indungsgemSlBen Verfahrens ist die separate 
Behandlung von Aufrufen von SubConf durch IDChains. Dabei ist 
eine IDChain eine besondere Ausgestaltung einer SubConf mit 
folgender Eigenschaft: 
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Aus Performancegrttnden ist es sinnvoll, elnzelne SubConf 
innerhalb des CTTREE zu speichern, sozuaagen zu cachen» Bel 
Bedarf mufi eine SiibConf dann nicht kon^lett neu geladen 
werderi/ sondern wird von einer CT, die die entsprechende 
SubConf cached^ direkt an die untergeordneten CT gesendet. Bei 
einer IDChain ist wesentlich, daft von einer zentralen CT aus, 
alle untergeordneten CTs entsprechend des erfindungsgemSBen 
ProtoJcolls geladen werden. Dazu ist es am Ef fizientesten, wenn 
die sich am Tiefsten xm CTTREE befindende CT, die noch 
samtliche in der IDChain benannten PACs als Blatter besitzt, 
die IDChain cached. Noch tiefer liegende CTs dtlrfen nicht mehr 
cachen, da sie nicht mehr zentral tiber alien PACs der IDChain 
liegen. H5herliegende CTs verlieren an Effizienz, da ein 
langerer Kommunikationspfad notwendig ist. Hat ein Request eine 
CT mit vollstclndiger IDChain ftir die angeforderte EnhSubConf 
erreicht, 16st diese CT GRANTS an die beteiligten 
tieferliegenden CTs aus, wobei die Informationen aus der 
IDChain derart aufgeteilt werden (Splitting), daB zumindest 
der Teil jeweils Obertragen wird, der in den jeweiligen 
Zweigen benOtigt wird. Urn bei diesem Splitting das Kreuzen zu 
verhindem, mufi sichergestellt sein, dafi auch die nachste CT 
Stufe alle GE^Ts Ihres Teils der EnhSubConf ausl5st, und zwar 
ohne von GRANTS anderer EnhSubConf unterbrochen zu werden. 
Eine MCglichkeit dies zu realisieren ist, die betreffenden 
Teile der IDChain atomar zu Ubertragen. Dm das Caching von 
IDChains zu steuern ist es sinnvoll, eine geteilte IDChain 
wShrend der Obertragung zu kennzeichnen, beispielsweise durch 
ein „SPLIT** Flag. 
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Eine IDChain wird geteilt, sobald sie auf eine CT geladen 
wirdr die innerhalb der Hierarchie des CTTEIEE nicht mehr 
zentral Ober stotlichen innerhalb der IDChain ref erenzierten 
PACs liegt. In diesem Fall wird die IDChain nicht mehr von 
einer einzelnen CT innerhalb der Hierarchie verwaltet und 
gecached, Mehrere CTs verarbeiten jeweils den Teil der 
IDChain, der jeweils die PACs enthait, die Blatter der 
jewelligen CT sind.Ein REQUEST miifi immer bis zu einer CT 
weitergeleitet werden, die alle betreffenden PACs verwaltet. 
Das bedeutet, die hierarchisch erste und auch effizenteste CT 
(von den PACs aus betrachtet), die REQUEST in GRANT umwandeln 
kann, ist die erste CT in auf steigender Ordnung ausgehend von 
den Biattem, die eine komplette ungeteilte IDChain besitzt. 
Die Verwaltung der Liste mit den Zuweisungen von PAC zu ID 
bedarf keiner weiterer Eriauterung, Die Liste kann entweder 
von einem, innerhalb einer CT ablaufenden, Prograinm 
verarbeitet werden, oder aus einer Reihe von 
Assembleranweisungen zur T^steuerung der untergeordneten CTs 
ausgestaltet sein. 

Eine konqplette IDChain ist folgendermaBen aufgebaut: 
IDsnhsubconf I DChain { SittlT, (PACi : IDsubconfi) / ( PAC2 : 

IDsubConfz) r ( PAC3 : IDsnbCoDfa) / (PACn : IDsubConfn) } 

6.1 Pracachen von SubConf 

Innerhalb des CTTREEs werden SubConf nach bestimmten 
Bedingungen vorgeladen, d.h. gecached bevor sie eigentlich 
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benOtigt werden. Dieses Verfahren steigert die Performance 
innerhalb des CTTREE erheblich. 
Ausf tihrungsbeispiele : 

Es stehen eine Vielzahl von precache Anforderungen zur 
Verfagung. Die zwei hSufigsten sind: 

a) Innerhalb einer aktuell auf einer Low-Level-CT 
verarbeiteten SiibConf ist eine Ladeaufforderung far eine 
weitere SubConf programmier t . 

b) wahrend der Datenverarbeitung innerhalb des PAs wird 
entschieden welche SiibConf vorzuladen ist. Die dem PA 
zugeordnete CT wird diirch einen Trigger, der innerhalb der CT 
entsprechend auf die ID einer SiabConf tibersetzt wird, 
aufgefordert eine SubConf vorzuladen. Es ist auch mOglich, dafi 
die ID einer SubConf im PA berechnet wird oder vorher dort 
konflguriert wurde. Dann enthalt die Mitteilung an die 
zugeordnete CT die ID direkt. 

Die zu ladende SubConf wird nur gecachedf jedoch nicht 
gestartet. Der Start erfolgt erst zu dem Zeltpunkt an dem die 
SubConf ohne das vorherige cachen gestartet worden w^re. Der 
Dnterschied ist, daB zum Zeitpunkt der Startanforderung die 
SubConf bereits in der Low-Level-CT oder einer der mittleren 
CTs gespeichert ist und daher entweder sofort konfiguriert 
wird Oder sehr schnell auf die Low-Level-CT geladen und danach 
gestartet wird. Das zeitaufwendige Durchlaufen des gesamten 
CTTE^E entfailt. 
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Durch einen Compiler, der die SubConf generiert, ist 
entscheidbar, welche SubConf jeweils als nSchste gecached 
warden soil ten. Innerhalb des Programmablauf graphen ist 
ersichtlich/ welche SubConf als nachste ausgeftthrt werden 
k5nnten. Diese werden jeweils gecached. Die Programmausftihrung 
entscheidet zur Laufzeit^ welche der gecachten SubConf 
tats^chlich gestartet werden. 

Entsprechend des Mechanismus bestimmte SubConf vorzuladen 
(precache) ist ein Mechanismus implementiert/ der gecachte 
SiibConf entfernt, um im Speicher der CTs Platz ftir andere 
SvibConf zu schaffen. Ebenso wie das Vorladen ist das LCschen 
bestimmter SubConf durch den Compiler anhand des 
Programmausf Qhrungsgraphen vorhersagbar . 
Zusatzlich sind in den CTs die tiblichen Mechanismen zum 
Ldschen von SubConf implementiert (z.B. der zuletzt 
Konfigurierten, der zuerst Konfigurierte, der am seltensten 
Konfigurierten (siehe PACTIO)), um den Speicher der CTs 
entsprechend zu verwalten, Wesentlich ist, dafi nicht nur 
explizit vorgeladene SubConf 15schbar sind, sondem generell 
jede SubConf in einem CT-Speicher. Sofern der Garbage^ 
Kollektor die bestimmte SubConf bereits entfemt hat, verliert 
die explizite L6schung ihre GUltigJceit und wird ignoriert. 

Eine explizite LOschung kann durch einen Befehl bewirkt 
werden, der von einer beliebigen SubConf gestartet werden 
kaim. Dies beinhaltet eine beliebige CT innerhalb des Baumes, 
die eigene CT Oder sogar die explizite LOschung derselben 
SubConf (d.h. das LCschen der eigenen SubConf in der der 
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Befehl steht, wobei dabei das korrekte Terminieren 
sichergestellt warden mufi) - 

Eine weitere MOglichkeit der expliziten L5schung ist, 
innerhalb der PAs aufgrund eines bestiinmten Zustandes einen 
Trigger zu generieren, der an die CT weitergeleitet wird und 
als Anforderung zur expliziten LOschung ausgewertet wird. 

6.2 Abhanqlgkeiten gwlschen dan PAEs 

FQr den Fall, dafi die Reihenfolge, in der PAEs verschiedener 
PACs, die zu einer EnhSubConf gehOren, konfiguriert warden, 
nicht unerheblich ist, wird zur Sicherstellung der Einhaltung 
dieser zeitlichen Abhangigkeit ein weiteres Verfahren 
vorgeschlagen. Da bei mehreren PACs def initionsgemSlB auch 
mehrere CTs existieren, verstandigen sich diese untereinander, 
urn die Information auszutauschen, ob bisher alle PAEs, die vor 
den in jeder PAC nftchsten konfiguriert sein mttssen, bereits 
ihr GO aus derselben Konfiguration akzeptiert haben. 
Eine Mejglichkeit, die zeitlichen AbhMngikeiten aufzulOsen und 
das Senden von nicht erlaubten GOs zu verhindern, ist, 
zwischen den CTs das exklusive Recht zum Konfigurieren 
auszutauschen und die KW so uitizuordnen, daB eine korrekte 
Reihenfolge durch die Abfolge ihrer Konfiguration und die 
tlbergabe des Konf igurationsrechts sichergestellt wird. Je 
nachdem, wie stark die Abhangikeiten sind, kann es auch 
genttgen, wenn beide CTs bis zu einem Synchronisationspunkt 
parallel ihr zugeornetes PA konfigurieren, dann aufeinander 
warten und danach bis zum nachsten Synchronisationspunkt oder 
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- falls nicht vorhanden - bis zum Ende der EnhSubConf parallel 
welter konf igurieren • 

7, SubConf Makros 

Besonders ef fizient ist das Cachen von SubConf, wenn mdglichst 
viele SubConf gecached warden kdnnen. Insbesondere im Hinblick 
auf Hochsprachencompiler ist der effiziente Einsatz des 
Cachings sinnvoll, da Conqpiler auf Assemblerebene - in der 
VPU-Technologie SubConf Ebene - hSufig wlederkehrende Routinen 
erzeugen. 

Um SubConf mCglichst hSufig wiederzuverwenden, sollen SubConf- 
Makros (SubConfM) mit folgender Eigenschaft eingefdhrt werden 

• es werden keine absoluten PAE-Adressen angegeben. 
Vielmehr ist eine SubConf ein vorgelayoutetes Makro, das 
lediglich relative Adressen verwendet; 

• applikationsabhdngige Konstanten werden als Parameter 
fiber geben. 

Erst zu dem Zeitpunkt, an dem eine SubConf in das PA geladen 
wird, werden die absoluten Adressen berechnet. Parameter 
werden durch ihre tatsachlichen Werte ersetzt. Dazu wird eine 
modifizierte Kopie der urspranglichen SubConf derart erstellt, 
dafi entweder (i) diese Kopie in den Speicher der CT abgelegt 
wird (integrierter FILMO) oder (ii) sofort in das PA 
geschrieben wird und nur die zurtickgewiesenen KWs (REJ) in den 
FILMO geschrieben werden (separater FILMO) . Besonders im Fall 
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(ii) bietet sich aus Performancegranden eine Ausgestaltung des 
Adressaddierers in Hardware an, der direkt am Interf aceport 
der CT zum PA/FILMO sitzt. Ebenso sind Hardware 
Implement ierungen der Parametertransformation denkbar, 
beispielsweise durch eine Lookup Tabelle, die vor der 
Konfiguration geladen wird. 

8. Znrticlcgpeichom der Cachast&tdLsiaJ: 

Aus WO 99/44120 (PACTIO) ist eine applikationsabhangige 
Cachestatistik und -steuerung bekannt. Dieses Verfahren bietet 
ein zusatzlich eine datenabhSngige Optimierung des 
Cacheverhaltens, da sich das datenabhangige Programmverhalten 
direkt in der Cacheoptimierung ausdrtlckt. 

Nachteil des bekannten Verfahrens ist^ dafl sich das 
Cacheverhalten erst wahrend der Laufzeit optimiert, Bei einem 
Neustart der Applikation ist die Statistik verloren. Oftinals 
noch kritischer ist, daB beim Entfernen einer SubConf aus dem 
Cache auch deren Statistik verloren geht und selbst innerhalb 
der gleichen Applikationsverarbeitung bei einem erneuten 
Aufruf nicht mehr zur Verfttgung steht. 

Erfindungsgemaa wird vorgeschlagen die Cachestatistik zusammen 
mit der betref fenden ID beim Terminieren einer Applikation 
Oder beim Entfernen einer SubConf aus dem Cache zunSchst 
mittels der bekannten Inter-CT-Kommunikation solange an die 
nMchsthdhere CT zu senden, bis die ROOT-CT die jeweilige 
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Statist ik erhalt. SubConfDiese speichert die Statistik in 
einem geeigneten Speicher, je nach Anwendung in einem 
fiachtigen, nicht flUchtigen oder Massenspeicher. Der Zugriff 
auf den Speicher erfolgt gegebenenf alls tiber einen Host. Die 
Speicherung erfolgt dabei derart, dafi sie der jeweiligen 
SubConf der art zugeordnet ist, daB bei einem Neuladen der 
SubConf die Statistik mitgeladen werden kann. 
SubConfBei einem Neustart der SubConf wird sie mit an die Low- 
Level-CT geladen. 

Der Compiler baut entweder eine neutrale leere Statistik auf 
Oder generiert nach einem geeigneten Verfahren bereits eine 
Statistik die als zunSchst geeignet erscheint. Die vom 
Compiler vorgegebene Statistik wird dann gemSB dem 
beschriebenen Verfahren zur Laufzeit optimiert, gespeichert 
und steht bei einem weiteren Auf zruf der Applikation in der 
optimierten Fassung. zur VerfUgung. 
SubConf 

Sofern eine SubConf von mehreren Applikationen oder innerhalb 
einer Applikation von unterscheidlichen Low-Level-CTs benutzt 
wird (Oder von unterschiedlichen Routinen aus aufgerufen wird) 
ist das Ftlhren einer Cache-Statistik nicht sinnvoll, da davon 
ausgegangen werden muB, dafi das jeweils unterschiedliche 
Aufruf- und Ablauf-Verhalten eine jeweils unterschiedliche 
Statistik hervorrufen wird. 

Je nach Anwendung wird deshalb entweder auf eine Statistik 
verzichtet oder ein SubConfM verwendet. 
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Bei Verwendung eines SubConfM wird die ParameterObergabe 
derart erweitert, dafi die Cachestatistik als Parameter 
Qbergeben wird. Teminiert eine SubConfM wird die 
Cachestatistik an die, die SubConfM vormals aufrufende SubConf 
(ORIGIN), zurtickgeschrieben. Die Parameter werden dann 
zusammen mit der Cachestatistik von ORIGIN bei der 
Terminierung von ORIGIN gemS3 dem beschriebenen Verfahren 
gespeichert und bei einezn nachfolgenden Aufruf entsprechend 
geladen und als Parameter wiederum an die SubConfM iibergeben. 

Das Ftlhren und Speichern von applikationsbezogenen 
Cachestatistiken ist grundsatzlich auch fiir Mikroprozessoren, 
DSPs, FPGAs und ahnliche Bausteine geeignet. 

9, Aafban des Kbnfiqarationsbnssystems 

In PACT07 wird ein Datenbus system beschrieben, das adressiert 
und gepipelinet aufgebaut ist. Dieses Bussystem ist generell 
auch zur Obertragung von Konfigurationsdaten geeignet. 
Dm Daten und Konfigurationen tiber dasselbe Bussystem zu 
tibertragen, werden Statussignale eingefOhrt, die die Art der 
tlbertragenen Daten anzeigen. 

Das Bussystem wird dabei derart ausgestaltet, daB die CT 
Konfigurations- und Datenregister von einer zuvor von der CT 
adressierten PAE optional zurticklesen kann. 

Ober das Bussystem werden sowohl globale Daten im Sinne von 
PACT07, als auch KWs tibertragen. Die CT agiert als eigener 
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Busknoten- Ein Statussignal kennzeichnet den 

tJbertragungsmodus . Folgender Aufbau mit den Signalen SO und SI 
ist beispielsweise mdglich: 



SI 


so 


Bedeutung 


0 


0 


Daten schreiben 


0 


1 


Daten lesen 


1 


0 


Schreiben eines KW und/oder einer PT^-Adresse 


1 


1 


Rtlcksenden eines KW oder beliebigen Registers von 
der adressierten PAE 



Zum Busprotokoll (ACK) nach PACT07 wird das Signal REJ 
hinzugeftigt, urn der CT ZurUckweisungen gemSB des FILMO- 
Protokolls zu signalisieren. 



10- ZusaimnBTifassen von e±nzelnen Reqistem 
Zur logischen Trennung von Konfigurationsdaten werden 
unabhangige Konfigurationsregister verwendet. Die logische 
Trennung ist besonders fllr die differentielle Konfiguration 
erforderlich, da logisch getrennte Konfigurationsdaten fttr 
gewOhnlich bei der Durchftthrung einer differentiellen 
Konfiguration nicht bekannt sind. Dadurch entsteht eine groBe 
Menge an einzelnen Konfigurationsregistern/ wobei jedes 
einzelne vergleichsweise wenig Information beinhaltet. Im 
folgenden Beispiel sollen die 3-bitigen Konf igurationswerte 
KW-A,B,C,D unabhangig voneinander geschrieben oder modifiziert 
vrerden k5nnen: 



0000 


0000 


0000 


0 


KW-A 


0000 


0000 


0000 


0 


KW-B 
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0000 


0000 


0000 


0 


B(W-C 


0000 


0000 


0000 


0 


KW-D 



Ein derartiger Registersatz ist ineffizient, da die Bandbreite 
des CT-Busses nur zu einem Bruchteil benutzt wird. 



Der Aufbau von Konfigurationsregistern kann erheblich 
optimiert werden, indent jeweils einem Konfigurationswert ein 
Enable zugeordnet wird, das anzeigt ob der Wert bei dem 
aktuellen Konfigurations transfer tiberschrieben werden soil. 

Die Konf igurationswerte ECW-A,B,CfD des obigen Beispiels werden 
in einem Konfigurationsregister zusammengefaBt. Jedem Wert 
wird ein Enable zugeordnet. Ist beispielsweise EN-x logisch 
,,0'" wird KW~x beim aktuellen Transfer nicht verSndert, ist EN- 
X logisch wird KW-x durch den aktuellen Transfer 
tiberschrieben. 



En-A 


KW-A 


En-B 


KW-B 


En-C 


KW-C 


En-D 


KW-D 



11. Wave Rekonfiqnration (WRC) 

Aus PACT13 ist ein Rekonfigurationsverfahren (Wave- 
Rekonfiguration = WRC) bekannt, bei welchem die 
Rekonfiguration direkt und zeitlich mit dem Datenstrom 
synchronisiert ist (Figur 24 in PACT13) . 

Wesentliche ftlr die Funktion der Wave Rekonfiguration ist, dafi 
unkonfigurierte PAEs Daten und Trigger weder annehmen noch 
senden. Das bedeutet, dafi sich eine unkonfigurierte PAE 
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vollkommen neutral verhSlt. Dies kann in der VPU-Technologie 
durch die Verwendung der Handshake-Signale (RDY/ACK) fUr 
Trigger- und Datenbusse erreicht werden(vgl. PACT02). Eine 
unkonfigurierte PAE generiert dabei 

• keine RDYs, wodurch keine Daten oder Trigger gesendet 
wexden, 

• keine ACKs, wodurch keine Daten oder Trigger empfangen 
werden. 

Diese Funktionsweise ist nlcht nur ftir die Wave- . 
Rekonfiguration hilfreich, sondern ist eine der m^glichen 
Grundlagen ftir die Runtiine-Rekonf igurierbarkeit der VPU- 
Technologie . 

Im Folgenden wird eine Erweiterung de& Verfahrens ausgefahrt: 
Die Rekonfiguration wird mit der laufenden Datenverarbeitung 
synchonisiert. Innerhalb der Datenverarbeitung im PA ist 
entscheidbar, 

i. welche n£Lchste SubKonf bei der Rekonfiguration notwendig 
wird; 

ii. zu welchem Zeitpunkt die SubConf aktiv werden muB, also 
mit welchem Datenpaket (ChgPkt) die SubKonf verknQpft 
werden mufi. 

Die Entscheidung, welche Konfiguration geladen wird, wird 
durch Bedingungen gefSllt und durch Trigger 
(WaveConfigurationPreload = WCP) reprMsentiert . 
Die Verknttpfung der Datenpakete mit den KWs einer SubConf wird 
dabei durch die Datenbus- (RDY/ACK) und CT-Bus- 
{CHECK,ACK/REJ) Protokolle sichergestellt . Bin zusatzliches 
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Signal (WaveConfigurationTrigger = WCT) zeigt an, bei welchem 
Datenpaket (ChgPkt) umkonfiguriert werden soil und ggf. welche 
neue Konf iguration ausgefUhrt, bzw. geladen werden soil. WCT 
kann durch einfache zusStzliche Leitungen oder das 
Trigger system der VPD-Technologie realisiert werden. Mehrere 
WCT kttnnen gleichzeitig im PA verwendet werden, wobei jedes 
Signal eine andere Umkonf iguration steuern kann. 

11.1 Steuerong der Wave Reconfiguration 

Es kann zwischen zwei applikationsabhSngigen WRC unterschieden 
werden: 

Al) Wave Rekonf iguration innerhalb einer SubConf 
A2) Wave Rekonf iguration unterschiedlicher SubConf 

Hardwaretechnisch wird bevorzugt zwischen zwei grundlegenden 
Iznplementierungsarten unterschieden : 

11) Inplementierung in der CT xind Ausftlhrung jeweils nach 
Anforderung 

12) Implementierung durch zusMtzliche Konf igurationsregister 
(WRCReg) in den PAEs. Mdgliche Ausgestaltungen der WRCReg 
werden nachfolgend beschrieben. Die WRC werden entweder 

a) bei der ersten Konf iguration der betreffenden SubConf von 
der CT vorgeladen, 

b) Oder von der CT wahrend der AusfQhrung einer SubConf 
abhangig von eintreffenden WCP vorgeladen. 

wahrend der Datenverarbeitung werden die jeweils gtlltigen 
WRCReg durch ein Oder mehrere WCT selektiert. 
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Im Folgenden soil die Auswirkung der Wave Rekonf iguration auf 
das FILMO-Prinzip diskutiert werden: 

11,1.1 Durchfahrung der WRC nach Al 

Innerhalb eln und derselben SubConf (Al) ist die 

Rekonf iguration mittels WRC jederzeit mOglich. ZunSchst wird 

die SubConf normal konfigurlert, wodurch das FILMO-Prinzip 

sichergestellt ist. Eine Forderung ist^ daii WRCs w^hrend der 

Prograininausfilhrung ausschliefilich bereits fttr die StibConf 

alloziierte Resourcen verwenden. 

Fall II) 

Die WRC wird durch differentielle Konfiguration der 

betreffenden PAEs durchgefahrt. WCP wird an die CT geleitet. 

Abh^ngig vom WCP wird auf ein Token innerhalb der 

konfigurierten SubConf gesprungen: 

beginSubConf 

main: 

PAE 1, CHECK&GO 
PAE 2, CHECK&GO 
• . • 

PAE n, CHECK&GO 
set TriggerPortl // WCT 1 
set TriggerPort2 // WCT 2 
scheduler: 

on TriggerPortl do mainl // Jump depending on WCT 
on TriggerPort2 do inain2 // Junq? depending on WCT 
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wait: 

wait for trigger 
mainl: 

PAE 1, DIFFERENTIAL&GO 
PAE 2, DIFFERENTIAL&GO 

PAE n, DIFFERENTIAL&GO 
wait for trigger 
iaain2 : 

PAE 1, DIFFERENTIAL&GO 
PAE 2, DIFFERENTIAL&GO 

PAE DIFFERENTIAL&GO 
• wait for trigger 
endSubConf 

Das Interface (TrglO) zwischen CT und WCP wird durch ^set 
TriggerPort" konf iguriert . TrglO verhait sich gem^fi der FILMO- 
Protokolls wie eine PAE gegentlber der CT, d.h. TrglO 
entspricht exakt dem CHECK, DIFFERENTIAL, GO Protokoll und 
antwortet far jeden Trigger einzeln oder eine Gruppe gemeinsam 
mit ACK Oder RE J. 

Je nachdem ob ein bestimmter Trigger 
bereits konfiguriert ist mit REJ 

Oder 

bereit zur Konfiguration ist mit ACK. 
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Figur 8 aus PACTIO ist um dieses Protokoll entsprechend zu 
erweitern . 

Bei Eintreffen von WCT startet die jeweilige PAE die 
entsprechende Konfiguration. 

12) 

Entweder 

werden die WRCReg bereits wahrend der Konfiguration 
beschrieben und der WCP entfailt, da bereits die komplette 
SubConf in die jeweilige PAE geladen ist 
Oder 

abhangig durch bestimmten WCP werden von der CT bestiromte 
WRC in unterschiedliche in der WRC definierte WRCReg 
geladen. Dies ist besonders dann notwendig^ wenn ausgehend 
von einer SubConf durch auf tretende WRT in mehrer 
unterschiedliche WRC verzweigt wird als physikalische WRCReg 
vorhanden sind* 

Die TriggerPorts innerhalb der PAEs werden konfiguriert, dali 

durch bestimmte eingehende WRT bestimmte WRCReg selektiert 

werden : 

beginSubConf 

main: 

PAEl_TriggerPortl 
PAEl_TriggerPort2 
PAEl_WRCRegl 
PAEl_WRCReg2 
PAE1_BASE, CHECK&GO 
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PAE2__TriggerPortl 
PAE2_TriggerPort2 
PAE2_WRCRegl 
PAE2_WRCReg2 
PAE2_BAS£, CHECK&60 

PAEn_TriggerPortl 
PAEn_TriggerPort2 
PAEnJBmCRegl 
PAEn_WRCReg2 
PAEn_BASE, CHECK&GO 
endSiibConf 

11,1,2 DurchfUhrunq der WRC nach A2 
Fall 11} 

Die DurchfOhrung einer WRC zwischen unterschiedlichen SiibConf 
durch die CT entspricht prinzipiell Al/Il. Wesentlich ist, dafi 
die Triggerports und der CT-inteme Ablauf dem FILMO-Prinzip 
entsprechen- KWs die von den PAEs zurQckgewiesen wurden (RE J) 
werden auf den FILMO geschrieben. Die Grundlagen sind aus 
PACTIO bereits bekannt. 

samtliche WCP werden durch die CT ausgeftlhrt, wodurch eine 
Deadlock freie (Re-)Konfiguration gewflhrleistet ist. 
Ebenso wird der Zeitpunkt der Rekonf iguration, der durch WCT 
gekennzeichnet ist an die CT geleitet und von der CT atomar 
behandelt, d.h. alle durch die Rekonfiguration betroffenen 
PAEs erhalten die Rekonfigurationsaufforderung durch WCT 
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entweder zeitgleich oder zumindest ohne Unterbrechung durch 
eine andere Rekonfigurationsauf f orderung^ wodurch die 
Deadlock-Freiheit wiederum gewShrleistet ist. 

Weiterfiihrende Ausgestaltungen sind innerhalb dieser Schrift 
vorausgehend beschrieben. 

Fall 12) 

Entweder 

werden die WRCReg bereits wShrend der Konf iguration 
beschrieben und der WCP entfailt, da bereits die k<»nplette 
SubConf in die jeweilige PAE geladen ist 
Oder 

abh^ngig durch bestimmten WCP werden von der CT bestimmte 
WRC in unterschiedliche in der WRC definierte WRCReg 
geladen. Dies ist besonders dann notwendig, wenn ausgehend 
von einer SubConf durch auftretende WRT in mehrer 
unterschiedliche WRC verzweigt wird als physikalische WRCReg 
vorhanden sind* 

Es muB verhindert werden, dafl mehrere WOT zu unterschiedlichen 
Zeiten an unterschiedliche PAEs geftihrt werden, da dadurch 
Deadlocks entstehen. Beispiel: WCTl einer SubConf SA erreicht 
bei Takt tl die PAE pi, WCT2 einer SubConf SB erreicht zu dem 
Zeitpunkt die PAE p2. Die PAEs werden entsprechend 
konfiguriert. Zum Zeitpunkt t2 erreicht WCTl p2 und WCT2 pi. 
Ein Deadlock ist eingetreten. Es soli noch darauf hingewiesen 
werden, dafi dieses Beispiel prinzipiell auch auf A2'-I1 
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angewendet werden kann, weshalb dort WCT iiber den Triggerport 
der CT gefOhrt und von der CT abgewickelt wird* 

Ein Deadlock wird auch verhindert, indem die von 
unterschiedlichen PAEs (Quellen) generierten WCT von einer 
zentrale Instanz (ARB) derart priorisiert werden, dafi zu einem 
Takt exakt ein WCT an die betreffende PAEs gesendet wird. 
Verschiedene Verfahren sind zur Priorisierung anwendbar, 
beispielhaft sollen einige genaimt werden: 

a) Verwendung eines Arbiters nach dem Stand der Technik, 
insbesondere eignet sich der Round-Robin Arbiter nach 
PACTIO. Die exakte zeitliche Reihenfolge des Auftretens 
der WCT geht dabei fiir gewdhnliche verloren. 

b) Sofern die zeitliche Reihenfolge eingehalten werden soil, 
bieten sich beispielsweise folgende Verfahren an: 

bl) Ein FIFO speichert zunSlchst die eingehenden WCT 

entsprechend ihrer Reihenfolge. Zeitgleich eingehende WCT 
werden gemeinsam gespeichert, treten zu einem Zeitpunkt 
keine WCT auf, wird kein Eintrag erzeugt. Ein dera FIFO 
nachgeschalteter Arbiter wahlt einen der Eintrfige aus, 
sofern mehrere gleichzeitig auftraten. 

b2) Aus PACT18 ist ein Verfahren bekannt/ das eine 
zeitliche Sortierung von Ereignissen mittels einer 
zugeordneten Zeit information (Timestamp) ermOglicht. 
Durch Auswerten der Timestamp kann die zeitlich korrekte 
Abfolge der WCT sichergestellt werden. 
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Durch eine geeignete Weiterleitung der WCT von ARB an die 
betreffenden PAEs wird sichergestellt^ dafi die priorisierten 
WCT in der korrekten Reihenfolge bei den PAEs ankoramen. Die 
einfachste MOglichkeit die Reihenfolge sicherzustellen ist, 
dafi s^tliche von ARB abgehenden Trigger zu den jeweiligen 
PAEs exakt dieselbe Ldnge und Laufzeit aufweisen. Dies wird 
durch eine geeignete Programmieriing Oder ein geeignetes Layout 
durch einen Router sichergestellt, indexa die LeitungsfOhrung 
entsprechend abgeglichen wird und an den entsprechenden 
Punkten Register zum Abgleich der Latenz eingesetzt werden. 
Auch zur Sicherstellung der korrekten Weiterleitung kann das 
nach PACT18 bekannte Verfahren zur zeitlichen Synchronisation 
von Informationen verwendet werden. 

Eine explizite Priorisierung der WCP ist nicht notwendig/ da 
die an die CT geftihrten WCP durch das FILMO-Prinzip innerhalb 
der CT wie bereits erlSutert ordentlich abgearbeitet werden. 
Die Einhaltung der zeitlichen Reihenfolge kann gegebenenfalls 
insbesondere entsprechend des FILMO-Prinzipes (vgl. 2.1e) 
eingehalten werden. 

11.1,3 Anmerkung far samtliche Faile 
Die fUr die Wave-Re konfigur at ion zus^tzlichen 
Konfiguratlonsregister der PAEs verhalten sich entsprechend 
des FILMO-Prinzipes, d.h. die Register unterstatzen die 
beschriebenen ZustSnde und implementierten Abl^ufe und 
reagieren entsprechend auf die Protokolle (z.B. CHECK/ACKREJ) . 
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11 . 2 Rekonf igiirationgprotokolle und tofban der WRCReg 

An drei alternative Rekonfigurationsprotokollen soil das 
Verfahren der Wave Reconfiguration genauers erlSLutert werden: 
Noxmales CT-Protckoll: Die CT rekonfiguriert erst nach 
Eintreffen einer Rekonfigurationsanforderung jede PAE einzeln, 
wobei die CT fttr jede PAE, die ChgPkt erreicht, eine 
Rekonfigurationsanforderung erhalt. Diese Methode ist 
ineffizient, da der Koinmunikationsaufwand insbesondere fttr 
gepipelinte Bussysteme sehr hoch ist. 

Synchronlsierte Pipeline: Dieses Protokoll ist bereits 
wesentlich effizienter. Der gepipelinte CT-Bus wird als Puffer 
verwendet, indem das einer PAE zugeordnete Pipeline-Register, 
die KW dieser PAE so lange speichert, bis diese PAE die BCW 
aufnehmen kann. Die CT-Bus Pipeline (CBP) wird damit zwar 
blockiert, kann aber kcatiplett mit den KWs der Wave 
Rekonfiguration gefUllt werden. 

a) Sofern die CBP in dieselbe Richtung wie die Datenpipeline 
veriauft, gehen jeweils einige Takte Latenzzeit verloren, bis, 
nachdera eine PAE ein KW aufgenommen hat, das KW der direkt 
nachfolgenden PAE an deren Pipeline-Register eintrifft. 

b) Veriauft die CBP entgegen der Datenpipeline, kann die CBP 
komplett mit KW geftlllt werden, die bereits an der bestimmten 
PAE anstehen. Damit ist eine Wave-Rekonfiguration ohne 
zeitliche Verzagerung mttglich. 
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Synnhronxsxertes Schattenregister (ef f izientestes Protokoll) : 
Die CT schreibt sofort nach Auswahl der SubConf (i) vor 
Eintreffen von ChgPkt (ii) die neuen KWs in Schattenregister 
s&ntlicher PAEs. Die Schattenregister k5nnen in beliebiger 
Ausgestaltung implementiert sein. Folgende MOglichkeiten 
bieten sich z.B. besonders an: a) Vor die eigentlichen 
Konfigurations register geschaltete Registerstufe, b) 
paralleler Registersatz der aber Multiplexer ausgewahlt wird, 
c) FIFO-Stufe vor den eigentlichen Konfigurationsregistern. Zu 
dem Zeitpunkt an dem ChgPkt (ii) bei einer PAE eintrifft, 
kopiert sie das Schattenregister in das entsprechende 
Konf igurationsregister . Das Kopieren geschieht im Optimalfall 
derart, dali kein Arbeitstakt verloren geht. Sollte trotz 
Eintref fens von ChgPkt das Schattenregister nicht beschrieben 
sein (also leer) setzt die Datenverarbeitung bis zum 
Eintreffen der im Schattenregister aus. Bei Bedarf wird die 
Rekonfigurationsanforderung mit dem ChgPkt innerhalb einer 
Pipeline von einer FAB zu nSchsten weitergeleitet. 

12. gormen der Para 1 lei it&t und seqnentielle Bearbextunq 

Durch eine hinreichend hohe Rekonf igurationsperformance lassen 
sich sequentielle Rechenmodelle in Arrays abbilden^ indem die 
Low-Level-CTS quasi einen konventionellen Codefetcher 
darstellen und das Array als VLIW-ALU mit 
mikroprogrammierbarer Vernetzung arbeiten. 
Weiterhin lassen sich stotliche Formen der Parallelitdt in. 
Arrays aus Rechenelementen abbilden: 
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Fipelliiing: Pipelines lassen sich durch in Reihe geschaltete 
PAEs aufbauen. Die VPU-gemSfien Protokolle erlauben die 
einfache Steuerung der Pipeline. 

Instiruction Level Pairallelitat: Parallele Datenpfade sind 
durch parallel geschaltete PAEs aufbaubar. Die VPU-gemafien 
Protokolle und besonders die Triggersignale erlaiiben die 
einfache Steuerung. 

SMP, Mal^tasking und Hul'biQsei:: Durch die Deadlockfreiheit 
der Konfigurationsverfahren kOnnen unabhangige Tasks 
automatisch parallel in einem PA ausgeftihrt werden. 

Bei ausreichender Anzahl von PAEs k5nnen auch alle 
wesentlichen Telle konventioneller Mikroprozessoren auf das PA 
konfiguriert werden. Dann kann eine sequentielle Bearbeitung 
einer Aufgabe auch ohne CT erfolgen. Diese muB erst wieder 
aktiv werden, wenn der konfigurierte Prozessor eine teilweise 
andere Funktionalitat, beispielsweise in der ALU^ erhalten 
Oder komplett ersetzt werden soil. 

13 , Aasf lihrmigsbeispiele und Piaqraimne 

In den Figtiren 1-3 1st der bespielhafte Aufbau einer SubConf 
dargestellt. CW-PAE kennzeichnet die Nunnner eines KWs 
innerhalb einer PAE mit der Adresse PAE (z.B. 2-3 ist das 2,KW 
fQr die PAE mit der Adresse 3) . Weiterhin sind die Flags 
dargestellt {C-Check, D=Differential, G=Go) , ein gesetztes 
Flag ist mit gekennzeichnet . 
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In Figur 1 ist der einfachste lineare Aufbau einer SubConf , 
wie er z.B. gemSS PACTIO tiblich ist dargestellt. Eine PAE wird 
wahrend der ersten Konf iguration getestet (C) , dann 
vieiterkonfiguriert (D) und abschlieftend gestartet (G) (siehe 
PAE mit Adresse 0) . Auch der gleichzeitige Test und Start ist 
mOglich (CG, siehe PAE mit Adresse Ir 0101). 

In Fi-gur 2 ist eine darart umsortierte SubConf dargestellt, 
dafi eine Barrier (0201) eingefohrt wurde. Vor der Barrier 
mQssen alle PAEs getestet werden. Die Barrier wartet dann bis 
zum Eingang aller ACKs Oder REJs. Sofern kein RE J auftritt 
wird die Barrier tlbersprungen, die differentiellen 
Konfigurationen werden durchgeftihrt und die PAEs werden 
gestartet. Bei Auftreten eines RE J wird die Barrier nicht 
tibersprungen^ statt dessen werden FILMO-Mufe ausgeftthrt, bis 
kein RE J mehr auftrat, danach. wird Barrier tlbersprungen. 
Vor der Barrier mufi jede PAE getestet und erst danach dtlrfen 
die PAEs differentiell konfiguriert und gestartet werden. 
Sofern Test und Start ursprQnglich im selben Zyklus stattfand, 
muB das KW jetzt getrennt werden (0101 -> 0202/ 0203). 

In Pigur 3 wird eine SubConf derart umsortiert, daB keine 
Barrier notwendig ist, statt dessen eine Latenzzeit zwischen 
Check und dem Eintreffen von ACK/REJ eingefUgt wird, wahrend 
der kein weiterer Check durchgeftihrt werden darf . Dazu werden 
die KWs zu Atomen (0301) zusammengefaAt, wobei das erste KW 
eines Atoms einen Check durchftlhrt (0302) und der Block dann 
mit differentiellen KWs oder ggf . NOPs (0303) bis zum Ablauf 
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der Latenzzeit gefailt wird. Die Anzahl der dif ferentiellen 
KWs hclngt von der Latenzzeit ab. Aus Darstellungsgrtlnden wurde 
exemplarisch eine Latenzzeit von 3 Takten gewahlt. Bei 0304 
trifft ACK/REJ ein, woraufhin entschieden wird, ob die 
Konfiguration mit dem nSlchsten KW, das einen Check enthalten 
kann (nicht unbedingt muB) weitergeftihrt (0305) wird, oder 
aufgrund eines REJs zur Wahrung der Reihenfolge abgebrochen 
i^ird. 

Wesentlich ist, daB bei der Konfiguration einer PAE X zunachst 
Check durchgefilhrt wird, dann auf das Eintreffen von ACK/REJ 
gewartet wird - wlhrend dieser Zeit kann eine bereits 
gecheckte PAE weiterkonf iguriert werden, oder es mttssen NOPs 
eingefiihrt werden. Erst dann kann PA£ X weiterkonf iguriert 
werden. Beispiel: Check der PAE (0302), Fortsetzung der 
Konfiguration (0306) . Bei 0307 mtissen NOPs nach einezn Check 
eingefUhrt werden, da keine differentiellen Konfigurationen 
zur Verftlgung stehen. 0308 zeigt das Aufteilen von 
Konfigurationen (iber mehrere B15cke (hier 3) hinweg, wobei ein 
Check ausgelassen wird (0309) . 

Fxgor 4 zeigt eine mOgliche Statemachine zur Realisierung der 
PAE Zustclnde. Der Grundzustand ist IDLE (0401). Durch 
Konfigurieren des Flags Check (0405) geht die Statemachine in 
den Zustand ^alloziiert"^ (0402). Konfigurieren des Flags LAST 
(0409, 0408) startet die PAE, der Zustand ist „konfiguriert^^ 
(0404) . Durch LocalReset (0407) geht die P2^ in den Zustand 
„unkonfiguriert^^ (0403) . In diesem AusfOhrungsbeispiel geht 
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die PAE erst nach Abfrage ihres Status durch LOCK/FREE (0406) 
nach IDLE zurtick. 

LocalReset und LAST k6nnen auch von der CT durch einen 
Broadcast versendet warden , siehe ModulID. 

Die Figuren 5-9 zeigen mGgliche Implementierungen der FILMO- 
Verfahren gemSB Abschnitt 5. Dabei werden lediglich die 
relevanten Baugruppen die als Interface zum PA dienen 
dargestellt. Schnittstellen zur CT werden nicht beschrieben, 
Diese sind weitgehend entsprechend dem Stand der Technik 
(PACTIO) implementierbar und bedilrfen gegebenenfalls nur 
geringer Modifikationen. 

Figur 5 zeigt den Aufbau einer CT-Interf aces zum PA bei 
Verwendung einer STATELDT nach 5.1. Eine CT 0501 mlt RAM und 
integriertem FILMO (0502) wird abstrahiert dargestellt und 
soil nicht naher eriautert werden, da die Funktion durch 
PACTIO und PACT05 nach dem Stand der Technik ausreichend 
bekannt ist. Die CT fragt den Status des PA (0503) durch 
Setzen des Signals LOCK (0504) ab, woraufhin jede PAE deren 
Status sich seit dem letzten LOCK geandert hat, diese Anderung 
an die STATELUT (0505) weiterleitet (0506) . Diese 
Weiterleitung geschieht derart, dafi die STATELUT eindeutig 
jeder PAE ihren Status zuordnen kann. Dazu stehen mehrere 
Verfahren nach dem Stand der Technik zur Verfttgung, 
beispielsweise kann jede PAE ihre Adresse zusammen mit dem 
Status an die STATELUT senden, die ftlr jede PAE unter deren 
Adresse deren Status speichert. 
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Die CT schreibt KWs (0510) zunSchst in ein Register (0507). 
Gleichzeitig wird ein Lookup unter der Adresse (#) der das 
jeweilige KW betreffende PAE in der STATELUT (0505) 
durchgefahrt. 1st der Status der PAE ,,unkonf iguriert*^ erhait 
die CT ein ACK (0509) , ansonsten ein RE J. Ein einfacher 
Protokollkonverter (0508) wandelt ein ACK in ein RDY^ urn das 
KW in das PA zu schreiben^ REJ wird in notRDY konvertiert, ijm 
das Schreiben in das PA zu verhindern. 

Es soli noch angemerkt werden, daB die Weiterleitung von LOCK, 
RDY und KW zum PA and im PA, ebenso wie die Ruckmeldung des 
Status der PAEs vom PA gepipelinet, d-h. durch Register 
veriauft. 

In Figur 6 ist das Verfahren nach 5.2 beispielhaft ausgeftlhrt. 
Der technische Aufwand ist verhSltnismafiig gering. Eine CT 
(0601) mit integriertem FILMO (0602) ist derart modifiziert, 
daft nur far das erste an das PA (0603) gesendete KW (0604) 
eines Atoms eine Quittung (0605) (ACK/REJ) erwartet wird. Die 
Quittung wird beim letzten KW eines Atoms ausgewertet. Bei ACK 
wird die Konfiguration mit dem nSchsten Atom fortgesetzt, REJ 
bewirkt den Abbruch der Konfiguration der SubConf • 

Figur 7 zeigt den Aufbau eines FILMOs (0701) nach 5.3. Dem 
FILMO ist der RELJMP-Speicher zugeordnet (0702), wobei jeder 
Eintrag im RELJMP einem FILMO-Eintrag zugeordnet ist. Der 
FILMO ist dabei als integrierter FILMO g^£lB PACTIO 
ausgestaltet, sodaB RELJMP eine verkettete Liste auf zu 
konfigurierende ECWs darstellt. Zudem soli besonders darauf 
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hingewiesen werden, dali in diesem Fall der FILMO auch CT- 
Befehle und Verkettungen derer gemafi PACTIO enthalten kann. 
Die verkettete Liste in RELJMP wird wie folgt generiert: 
Der Lesezeiger (0703) zeigt auf das KW, das aktuell 
konfiguriert wird- In 0704 ist die Adresse des KWs 
gespeichert^ das zuletzt zurUckgewiesen (RE J) wurde. Sofern 
das aktuell konfigurierte KW (0706) vom PA (0707) akzeptiert 
wird (ACK, 0708) , wird der, in 0702 an der Adresse auf die 
0703 zeigt gespeicherte, Wert zu 0703 dazuaddiert. Dadurch 
ergibt sich ein relativer Sprung. 

Wird dagegeh das aktuell konfigurierte KW zurUckgewiesen (REJ, 
0708) wird zunachst die Differenz aus 0703 und 0704, die 
mittels eines Subtrahierers (0705) berechnet wird, in RelJmp 
gespeichert, und zwar an der Adresse des zuletzt 
zurUckgewiesenen KW, die in 0704 gespeichert ist. In 0704 wird 
der aktuelle Wert von 0703 gespeichert. Danach wird der, in 

0702 an der Adresse auf die 0703 zeigt gespeicherte, Wert zu 

0703 dazuaddiert. Dadurch ergibt sich ein relativer Sprung. 
Die Steuerung tibernixmat eine Zustandsmaschine (0709), deren 
Implementierung gemaB des beschriebenen Ablaufes erfolgt. Ober 
einen Multiplexer (0710) wird die Adresse fQr den RelJmp durch 
0709 je nach Operation bestimmt, indem zwischen 0703 und 0704 
ausgewahlt wird. Urn 0701 und 0702 effizient gleichzeitig 
unterschiedlich adressieren zu konnen, ist sinnvoll bei der 
Implementierung 0702 physikalisch von 07O1 zu trennen, um zwei 
getrennt Speicher zu erhalten, die getrennt adressiert werden 
kOnnen. 
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0711 zeigt die Funktionsweise der relativen Adressierung. Die 
Adresse die auf einen Eintrag im RelJmp zeigt zum Inhalt von 
RelJmp dazuaddiert und ergibt die Adresse des nSchsten 
Eintrages . 

Fxgar 8 zeigt eine mttgliche Implementierung des Verfahrens 
nach 5.3 mit modifiziertem Garbage Collector. Die EintrSge im 
FIIiMO (0801) werden linear verwaltet, wodurch RelJiap nicht 
benfitigt wird. 0801 ist als separater FILMO inclement iert. 
Durch einen Lesezeiger (0804) werden die ECffs (0803) 
adressiert/ die in das PA (0802) geschrieben werden. samtliche 
KWs werden in der Reihenfolge ihrer Konfiguration in einen 
FIFO Oder FIFO-Shnlichen Speicher (0805), der beispielsweise 
auch als Schieberegister ausgestaltet sein kann, geschrieben. 
Der Speicher ist exakt so tief , wie Takte vom Absenden eines 
KWs an das PA, bis zum Eintreffen der Quittierung (RDY/ACK, 
0806) vergehen. 

• Bel Eintreffen elnes REJ wird das dem REJ zugewiesene 
zurCtckgewiesene das sich zu diesem Zeitpunkt am 
Ausgang des FIFOs befindet in 0801 geschrieben. REJ wird 
dazu als Schreib-Signal fQr den FILMO verwendet (REJ- 
>WR) . Die Schreibadresse wird durch einen Schreibzeiger 
(0807) generiert, der nach dem Schrelbzugriff 
inkrementiert wird. 

• Bei Eintreffen eines ACK geschieht nichts, das dem ACK 
zugewiesene konfigurierte KW wird ignoriert, 0807 bleibt 
unver^ndert. 



SS 



wo 02/13000 



PCT/EPOl/06703 



Dadurch entsteht eine neue lineare Folge aus zurtlckgewiesenen 
KWs im FILMO. Die Implemen tie rung des FILMOs als Dual-Ported- 
RAM mit getrenntem Schreib- und Leseport wird aus Performance- 
Grtinden vorgeschlagen. 

Figur 9 zeigt elne Implement ierung des Verfahrens nach 5.4. 
Dabei wird ersichtlich, dafi es sich dabei um eine Abwandlung 
des Verfahrens nach 5.3 handelt. 

Durch einen Lesezeiger (0909) wird das in das PA (0901) zu 
schreibende KW (0902) im FILMO (0910) adressiert. Die Adresse 
und Flags (0902a) der zu konf igurierenden PAE von 0902 wird 
zunSchst testweise an das PA gesendet. Das KW mit der Adresse 
der zu konf igurierenden P2VE wird in einen FIFO-ahnlichen 
Speicher (0903, entsprechend 0805) geschrieben* 0902a wird 
gepipelinet in das PA (ibertragen. In der adressierten PAE wird 
der Zugriff ausgewertet und quittiert. Die Quittung (RDY/ACK) 
wird ebenfalls gepipelinet zurtickgesendet (0904). 0903 
verzagert genausolang, wie Takte vom Absenden von 0902a an das 
PA, bis zum Eintreffen der Quittierung (RDY/ACK, 0904) 
vergehen. 

• Sofern mit ACK quittiert wurde, wird das komplette KW 
(0905) (Adresse + Oaten) am Ausgang von 0903 das der 
entsprechenden Quittung zugeordnet ist, gepipelinet an 
das PA gesendet (0906) . Eine Quittung daftir wird nicht 
erwartet, da bereits bekannt ist, daJi die adressierte PAE 
das KW akzeptiert. 
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• Bei REJ wird das KW in den FILMO zurackgeschrieben 

(0907). Dazu wird ein Schreibzeiger (0908) verwendet der 
0807 entspricht. Der Zeiger wird dabei inkrementiert . 
0904 wird dabei mittels eines einfachen Protokollkonverters 
(0911) (i) bei ACK in ein Schreibsignal far das PA (RDY) und 
(ii) bei REJ in ein Schreibsignal 0901 ftir den FILMO (WR) 
umgewandelt . 

Es entsteht eine neue lineare Folge aus zurttckgewiesenen KWs 
im FILMO. Die Implementierung des FILMOs als Dual-Ported-RAM 
mit getrenntem Schreib- und Leseport wird aus Performance- 
Grtlnden vorgeschlagen. 

Figur 10 zeigt ein Ausftlhrungsbeispiel ftir das • 
erfindungsgemafie Inter-CT-Protokoll. 4 Ebenen von CT sind 
dargestellt. Die RootCT (1001), CTs von 2 Zwischenebenen 
(1002a-b und 1003a-d) , die Low-Level-CTs (1004a-h) und deren 
FILMOs (lOOSa-h). Im 1004e zugeordneten PA wird ein Trigger 
generiert, der innerhalb von 1004e auf keine lokale SubConf 
tibersetzt werden kann^ sondern elner EnhSubConf zugeordnet 
ist. 1004e sendet an 1003c einen REQUEST far diese EnhSubConf. 
1003c hat die IDChain nicht gecached. Die EnhSubConf wird 
namlich partiell auch auf 1004g ausgeftihrt, die kein Blatt von 
1003c ist. Somit leitet 1003c den REQUEST an 1002b weiter. 
Durch die Schraffur wird angezeigt, daB 1002b die IDChain 
gecached haben keSnnte, da 1004g ein Blatt von 1002b ist. 
Angenommen 1002b hat jedoch IDChain noch nicht gecached und 
fordert diese daher bei 1001 an. 1001 lad die IDChain aus dem 
CTR (vgl, PACTIO) und sendet sie an 1002b. Der Vorgang wird 
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nachfolgend als GRANT bezeichnet- 1002b cached die IDChain, da 
samtliche beteiligten CT Blatter von 1002b sind. Danach sendet 
1002b atomar, also ohne Unterbrechung durch einen anderen 
GRANT, den GRANT an 1003c und 1003d • Dabei wird die IDChain 
gesplittet und an zwei verschiedene CTs gesendet, wodurch 
keiner der EmpfSLnger ein gemeinsamer Verwalter aller Blatter 
sein kann. Das Flag Split wird gesetzt, die Eicpf Singer und alle 
tieferen CTs kOnnen die IDChain nicht mehr cachen. 1003c und 
1003d senden wiederum atomar den GRANT an die Low-Level-CTs 
1004f bzw. 1004g. Die Low-Level-CTs speichern direkt den 
eingehenden GRANT in einer entsprechenden, die Reihenfolge der 
2u konfigurierenden SubConf kennzeichnenden Liste, die 
bespielsweise separat ausgestaltet sein kann oder durch die 
direkte DurchfQhrung der Konfiguration mit einer 
gegebenenfalls stattfindenden Eintragung zuruckgewiesener KKTs 
in den FILMO entstehen kann. 

Far die Low-Level-CTs ergeben sich zwei Varianten: 

• Entweder sle haben die zu startende der ID gemSlB IDChain 
entspechende SubConf berelts gecached, dann wird die 
Konfiguration sofort gestartet. 

• Oder sle haben die der ID gemdfi IDChain entsprechende 
SubConf noch nicht gecached, dann mtlssen sie diese erst 
bei den tlbergeordneten CTs anfordern. Die Anforderung 
(GET) ist in Figur 11 verdeutlicht, wobei wiederum davon 
ausgegangen wird, dafi keine der CTs aus den 
Zwischenebenen die SubConf gecached hat. Die jeweilige 
SubConf wird daher von der RootCT aus dem CTR geladen und 
an die Low-Level-CTs gesendet (DOWNLOAD) - Der Ablauf ist 
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prinzipiell aus PACTIO bekannt und soli daher nicht naher 

ausgefQhrt werden- 
In jedem Fall ist jedoch wesentlich, dafl nach Eintreffen eines 
GRANT dieser vor jedem weiteren GRANT ausgefuhrt wird. Trifft 
GRANT A vor GRANT B ein, so muB GRANT A vor GRANT B 
konfiguriert warden. Dies gilt auch dann, wenn die SubConf von 
GRANT A erst geladen werden mufi, wShrend die SubConf von GRANT 
B in der Low-Level-CT gecached ware und sofort gestartet 
werden kttnnte. Die Reihenfolge der eingehenden GRANTS muB 
eingehalten werden, da ansonsten ein Deadlock unter den 
EnhSubConf auftreten kann. 

In einer besonderen Ausgestaltung des beschriebenen Verfahrens 
kGnnen CTs des CTTREEs direkt auf Konfigurationen, ohne 
Einbeziehung der darQberliegenden CTs, zugreifen, indem sie 
eine Verbindung zu einem beleibig ausgestalteten, flUchtigen 
Oder nicht fiachtigen Speicher oder Massenspeicher besitzen. 
Dieser Speicher kann zum Beispiel ein SRAM, DRAM, ROM, Flash, 
CDROM, Festplatte Oder Serversystem sein, das ggf . auch 
mittels Netzwerk (WAN, LAN, Internet) angebunden ist. Es soil 
ausdrtlcklich erwahnt sein, daB also auch der direkte Zugriff 
einer CT unter Umgehung der dartiberliegenden CTs auf einen 
Speicher fUr Konfigurationsdaten m5glich ist. Auch in einem 
derartigen Fall findet die Synchronisation der Konfiguration 
innerhalb des CTTREE, insbesondere bei EnhSubConf, unter 
Einbeziehung der dartiberliegenden CTs statt. 

Flgar 12 zeigt drei Beispiele (Figur 12a-12c) . Dargestellt ist 
der Konfigurationsstack von 8 CTs (1201-1208). Der 
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Konfigurationsstack ist die Liste der zu konfigurierenden 
SubConf . Die SubConf warden in derselben Reihenfolge 
konfiguriert, wie sie in der Liste eingetragen sind. Bin 
Konfigurationsstack wird beispielsweise durch die Verkettung 
einzelner SubConf gebildet, wie dies in PACTIO Figur 26-28 
beschrieben ist. Eine andere MOglicOikeit ist eine einfache 
Liste von IDs die auf die SubConf zeigen, wie in Figur 12. 
Untere Einrage werden zuerst, H5here zuletzt konf iguriert . 
In Figur 12a sind zwei EnhSxibConf (1210, 1211) dargestellt, 
die korrekt im Konfigurationsstack der einzelnen CTs liegen. 
Die einzelnen SubConf der EnhSubConf werden in der richtigen 
Reihenfolge deadlockfrei konf iguriert- Die Reihenfolge der 
GRT^NTs wurde beachtet. 

Auch das Beispiel in Figur 12b ist korrekt. Drei EnhSubConf 
sind dargestellt (1220, 1221, 1222). 1220 ist eine groBe 
EnhSubConf die alle CTs betrifft- 1221 betrifft nur die CTs 
1202-1206, eine weitere betrifft die CTs 1207 und 1208. 
Samtliche SubConf werden deadlockfrei in der richtigen 
Reihenfolge konf iguriert . Der GRANT fttr 1222 wurde vollstandig 
vor dem GRANT fttr 1220 abgearbeitet und dieser vor dem GRANT 
far 1221. 

Das Beispiel Figur 12c zeigt mehrere Deadlockr-Situationen, In 
1208 wurde die Reihenfolge der GRANTS von 1230 und 1232 
vertauscht. Folge ist, daJ3 in dem 1208 zugeordneten PA 
Resourcen fttr 1230 belegt werden und in dem 1208 zugeordenten 
PA Resourcen ftir 1232. Die Respurcen sind jeweils fest 
alloziiert. Dadurch entsteht ein Deadlock, da keine EnhSubConf 
ausgeftthrt oder zuendekonf iguriert werden kann. 
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Ebenfalls sind in den CTs 1204 und 1205 die GRANTS von 1230 
und 1231 zeitlich vertauscht. Dadurch entsteht aus denselben 
GrUnden ebenfalls ein Deadlock. 

In Figur 13a ist eine Performance optimierte Version der 
Inter-CT-Kommunikation dargestellt. Dabei wird ein Download 
direkt zur Low-Level-CT durchgeftlhrt, d.h. CTs der mittleren 
Ebenen mflssen nicht zuerst die SubConf en«>fangen, speichern 
und dann weiterleiten. Vielmehr „h6ren« diese CTs lediglich 
mit (1301, 1302, 1303, LISTENER) und cachen die SubConf. 
Der schematische Busaufbau ist in Figtur 13b dargestellt. Ein 
Bypass (1304, 130S, 1306), nonnalerweise in Form eines 
Registers, fQhrt den Download an den CTs der mittleren Ebenen 
vorbei . 

Pignr 14 zeigt den mOglichen Aufbau einer Schaltung zwischen 
CT und PA, zur einfachen Konfiguration von SubConf Makros. Ein 
KW wird Qber den Bus (1401) von der CT tibertragen. Das KW wird 
in seine Konfigurationsdaten (1402), sowie die PAE Adressen X 
(1403) und Y (1404) zerlegt (bei mehrdimensionaler 
Adressierung sind entsprechend mehr Adressen zu zerlegen) . 
1405 addiert einen X-Offset zur X-Adresse und 1406 einen Y- 
Offset zur Y-Adresse. Die Offsets kOnnen unterschiedlich sein 
und sind in einem Register (1407) gespeichert. Der 
parametrisierbare Teil der Daten (1408) wird als Adresse auf 
eine Lookup-Tabelle (1409) geleitet, in welcher die 
tatsachlichen Werte gespeichert sind. Die Werte werden tlber 
mit den nicht parametriesierbaren Daten (1412) verkndpft 
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(1410) . Ober einen Multiplexer (1413) ist selektierbar ob ein 
Lookup durchgefiihrt werden soli oder ob die Daten direkt, ohne 
Lookup verwendet werden sollen. Die Auswahl wird mittels eines 
Bits (1411) durchgefiihrt* Samtliche Adressen und die Daten 
werden wieder verkntlpft und als Bus (1413)- an das PA gefOhrt. 
Je nach Inplementierung ist der FILMO. der beschriebenen 
Schaltung vor- oder nachgeschaltet; integrierte FILMOs werden 
vorgeschaltetr separate FILMOs nachgeschaltet. Cber den Bus 
1415 setzt die CT die Adressoffsets und die 

ParameterObersetzung in 1409. 1409 kann der Einfachheit halber 
als Dual-Ported-EIAM ausgestaltet sein. 



Der Aufbau eines entsprechenden KW ist wie folgt: 



X-Adresse 


y-Adresse 


Daten 


Adresse 
fiir 1409 


MUX = 1 


X-Adresse 


Y-Adresse 


Daten 


Daten 


MUX = 0 



Ist MUX = 1, wird ein Lookup in 1409 durchgefahrt^ bei MUX = 0 
werden die Daten direkt an 1414 weitergeleitet • 

In Figur 15 ist die Ausfxihrung eines Graphen verbildlicht . Die 
jeweils n^chsten mC^glichen Knoten (1..13) des Graphen werden 
vorgeladen (prefetch) , entsprechend werden vorhergehende 
Knoten und nicht genutzt Sprtinge gelOscht (delete) . Innerhalb 
einer Schleife werden die Knoten der Schleife nicht gel6scht 
(10,11/12), die entsprechenden Knoten werden erst nach 
Beendigung entfernt. Knoten werden nur geladen, wenn sie sich 
nicht bereits im Speicher der CT befinden. Ein mehrf aches 
Abarbeiten von (z.B.) 11 fllhrt daher nicht zum mehrf achen 
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laden von 12 oder 10. ,,delete 8,9"'^ wird in 11 ignoriert, 
sofern 8 und oder 9 bereits entfernt wurden. 

Figur 16 schematisiert die mehrfache Instantiierung eines 
SubConf Makros (1601). Verschiedene SubConf {1602, 1603, 1604) 
rufen 1601 auf . Die Parameter fUr 1601 werden von der jeweils 
aufrufenden SubConf in einer LookDp Tabelle (1605) vorgeladen 
(1610) . 1605 ist nur einmal implementiert, in Figur 16 jedoch 
mehrfach gezeichnet, um die verschiedenen Inhalte zu 
syiobolisieren • 

1601 wird aufgerufen. Die KWs werden an 1605, 1606 und 1607 

(ibertragen. Diese Elemente arbeiten wie folgt: 

Basierend auf einem Lookup wird der entsprechende Inhalt von 

1605 mit dem KWs wieder verkniipft (1606). Nach dem Multiplexer 

1413 (1607), der auswShlt ob das originale E(W gOltig ist oder 

ein Lookup durchgeftlhrt wurde, wird das Kff an das PA gesendet 

(1608). 

Figur 17 zeigt schematisch den Ablauf einer Wave 
Rekonfiguration. Einfach schraffierte Fiachen stellen 
datenverarbeitende PAEs dar, wobei 1701 PAEs nach der 
Umkonfiguration und 1703 PAEs vor der Umkonfiguration zeigen. 
Doppelt schraffierte FlSchen (1702) zeigen PAEs die gerade 
umkonf iguriert werden oder auf die Umkonfiguration warten. 
Figur 17a zeigt den EinfluB der Wave-Rekonfigurierung auf 
einen einfachen sequentiellen Algorithmus . Hier ist es 
m5glich, exakt die PAEs umzukonfigurieren, denen eine neue 
Aufgabe zugeteilt wird. Da in jedem Takt eine PAE eine neue 
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Aufgabe erhait kann dies effizient, namlich zeitgleich 
durchgefiihrt werden. 

Beispielsweise dargestellt ist eine Reihe von PAEs aus der 
Matrix ailer PAEs einer VPU. Angegeben sind die Zust^nde in 
den Takten nach Takt t mit jeweils einem Takt Verz5gerung. 

In Flgur 17b ist die zeitliche Auswirkung der Umkonf iguration 
von groAen Teilen dargestellt. Beispielsweise dargestellt ist 
eine Menge von PAEs einer VPU. Angegeben sind die ZustcLnde in 
den Takten nach Takt t mit einer unterschiedlichen Verz5gerung 
von jeweils mehreren Takten. 

Wahrend zun^chst nur ein kleiner Teil der PAEs umkonfiguriert 
wird Oder auf die Umkonfiguration wartet, wird diese FlSche 
mit zunehmender Zeit gr^Jfier^ bis alle PAEs umkonfiguriert 
sind. Das gr5fier werden der FlMche bedeutet^ daB, bedingt 
durch die zeitliche VerzOgerung der CMkonf iguration immer mehr 
PAEs auf die Umkonfiguration war ten (1702). Dadurch geht 
Rechenleistung verloren. 

Es wird daher vorgeschlagen ein breiteres Bussystem zwischen 
der CT (insbesondere des Speichers der CT) und den PlVEs 
einzusetzen, das gentigend Leitungen zur VerfUgung stellt, um 
innerhalb eines Taktes mehrere PAEs zugleich 
lomzukonf igur ieren . 
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Fignr 18 zeigt beispielhaft unterschiedliche 
Konfigurationsstrategien ftlr eln Rekonfigurationsverfahren 
ahnlich den ,,Synchronisierte Schattenregister*^ nach 11.2. 
Abgebildet ist dabei jeweils schematisch die CT (1801), sowie 
eine von mehreren PAEs (1804)/ wobei innerhalb der PAE jeweils 
nur die Konfigurationsregiater (1802, 1803) abgebildet sind, 
sowie eine Einheit zur Auswahl der aktiven Konfiguration 
(1805). Weitere Funktionseinheiten innerhalb der PAE wurden 
aus GrQnden der Obersichtlichkeit nicht dargestellt. Die CT 
besitzt jeweils n SubConf (1820)/ wobei in den Fallen -II 
jeweils die entsprechenden KW einer SubConf bei einem 
auftretenden WCP geladen wird (Kn)) und in den Fallen -12 die 
KW von m SubConf aus der Gesamtmenge von n geladen ' werden 
(m(n)). Die unterschiedliche Anbindung von WCT (1806) und WCP 
(1807) ist dargestellt, ebenso wie die optionalen WCP (1808) 
wie nachfolgend beschrieben. 

In Al-Il wird innerhalb derselben SubConf durch einen ersten 
Trigger WCP eine nSchste Konfiguration ausgewahlt, die 
dieselben Ressourcen nutzt oder deren Ressourcen zumindest 
bereits vorreserviert und durch keine andere aufier eventuell 
der WCP generierenden SubConf belegt sind. Durch die CT (1801) 
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wird die Konfiguration geladen. In dem hier gezeigten Beispiel 
wird die Konfiguration nicht direkt ausgefQhrt, sondern in 
eines von mehreren alternativen Register (1802) geladen. Durch 
einen zweiten Trigger WCT wird exakt zum Zeitpunkt der 
erforderlichen Rekonfiguration eines der alternativen Register 
derart ausgewdhlt, dafi das zuvor aufgrund von WCP geladene 
Konfiguration ausgefOhrt wird. 

Grundsatzlich wird durch WCP eine bestiiraate Konfiguration 
bestinmit und vorgeladen und durch WCT der Zeitpunkt der 
tatsachlichen der vorgeladenen Rekonfiguration entsprechenden 
Funktionsanderung bestimmt. 

Sowohl WCP als auch WCT kann ein Vektor sein, sodafi durch 
WCP(vi) eine von mehreren Konfigurationen vorgeladen wird, 
wobei durch die Quelle von WCP die vorzuladende Konfiguration 
spezifiziert wird. WCT{V2) wShlt entsprechend eine von 
mehreren vorgeladenen Konfigurationen aus. In diesem Fall ist 
eine der Menge der durch v2 wahlbaren Konfigurationen 
entsprechende Anzahl von 1802 erforderlich/ wobei ftir 
gew6hnlich die Anzahl fest vorgegeben ist, sodafi v2 der 
maximalen Menge entspricht. 

Ausgehend davon ist in A1-*I2 eine Version mit einem 
Registersatz 1803 mit einer Vielzahl von 1802 dargestellt. Im 
optimalen Fall ist die Anzahl der Register in 1803 derart 
grofi, daB s^tliche mCgllchen jeweils folgenden 
Konfigurationen direkt vorgeladen werden kOnnen, wodurch WCP 
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entfallen kann, sodafl lediglich der Zeitpunkt des 
Funktionswechsels sowie der Wechsel selbst durch WCT{V2) 
spezifiert wird. 

zeigt die WRC derart, da£ eine nSchste Konfiguration 
ausgewahlt wird, die nicht dieselben Ressourcen nutzt oder 
deren Ressourcen nicht vorreserviert oder durch eine andere 
auBer eventuell der WCP(vi) generierenden SubConf belegt sind. 
Die Deadlockfreiheit der Konfiguration wird durch die FILMO- 
konforme Reaktion und Konfiguration auf WCP(vi) gewahrleistet. 
Das Starten von Konf igurationen durch WCT(V2) (1806) wird 
ebenfalls von der CT durch die FILMO-konforme atoiaare Reaktion 
auf das Eintref fen von Triggern (ReconfReq) , die einen 
Rekonfigurationszeitpunkt kennzeichnen, atomar durchgef Uhrt . 

In A2-Z2 warden sdmtliche nachfolgenden SubConf entweder 
bereits beim ersten Laden einer SvibConf in die 
Konf igurations register 1803 vorgeladen, oder bedarfsweise, 
sofern die Anzahl der Konfigurationsregister nicht ausreicht, 
durch die CT mittels der bekannten Abwicklung eines 
auftretenden WCP(vi) nachgeladen. 
Die Trigger (ReconfReq, 1809), die einen 
Rekonfigurationszeitpunkt bestimmen und die eigentliche 
Rekonfiguration auslCsen werden zunSchst fiber einen geeigneten 
Priorislerer (1810) zeitlich derart entkoppelt und als WCT(V2) 
an die PAEs geleitet, daB immer nur exakt ein WCT{V2) zu einem 
Zeitpunkt an einer PAE aktiv ist und die Reihenfolge der 
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eintreffenden WCT(V2) bei alien betreffenden PAEs dieselbe 
ist. 

Bei A2-I1 und A2-I2 wird in diesen AusfUhrungsbeispielen ein 
zusatzliches Triggersystem veTOendet . Sowohl bei der 
Abarbeitung von WCT durch 1801, also auch bei einer 
Abarbeitung durch 1810 kann eine erhebliche Verzagerung bis 
zur Weiterleitung an 1804 auftreten. Es ist jedoch wesentlich^ 
dafi der Zeitpunkt ChgPkt zeitlich exakt eingehalten wird, da 
die PAEs ansonsten die nachfolgenden Daten falsch verarbeiten 
wUrden- Daher wird ein weiterer Trigger (1811, WCS = 
WaveConfigurationStop) verwendet, der lediglich die 
Datenverarbeitung der PAEs solange stoppt, bis durch das 
Eintreffen des WCT die neue Konf iguration aktiviert ist. WCS 
wird far gewOhnlich innerhalb der gerade aktiven SubConf 
generiert. In vielen Fallen kann ReconfReq und WCS identisch 
sein, da sofern ReconfReq innerhalb der gerade aktiven SubConf 
generiert wird, dieses Signal zumeist auch das Erreichen von 
ChgPkt kennzeichnet. 

Flgur 19 zeigt eine Iii5>leBientierungsvariante von A1-I2 und A2- 
12, wobei statt eines Registersatzes ein FIFO-Speicher (1901) 
zur Verwaltung der KW verwendet wird- Dabei ist die durch WCP 
vorgegebene Reihenfolge der SubConf fast. Durch das Auftreten 
von WCT (bzw, WCS, alternativ durch 1902 dargestellt) kann 
lediglich die nfilchste Konfiguration aus dem FIFO geladen 
werden. Die wesentliche Funktion von WCS, also das Anhalten 
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der laufenden Datenverarbeitung ist exakt dieselbe wie in 
Flgur 18 beschrieben. 

In Figtir 20 ist ein Abschnitt einer Zeile von PAEs 
dargestellt, um beispielhaft ein Rekonfigurationsverfahren 
ahnlich der „Synchronisierten Pipeline^' nach 11.2 zu 
verdeutlichen. Eine CT (2001) ist mehreren CT-Interface 
Baugruppen (2004) von PAEs (2005) zugeordnet. 2004 ist in 2005 
integriert und wird nur zur besseren Darstellung Funktion von 
WAIT und WCT abgesetzt dargestellt. Die Signale zur 
Obertragung der Konf igurationdaten von 2004 nach 2005 sind aus 
Grttnden der Abstraktion nicht dargestellt. 

Die CT ist mittels eines gepipelineten Bussystems an die 2004 
angebunden, wobei 2002 die Pipeline-Stufen daratellen. 2002 
besteht aus einem Register (2003b) far die Konfigurationsdaten 
(CW) und einem weiteren Register (2003a) mit integriertem 
Dekoder und Logik. 2003a dekodiert die in CW Obertragenen 
Adresse und sendet ein Signal ROY an 2004, sofern die 
betreffende lokale PAE adressiert ist, bzw. ein Signal RDY an 
die nachste Stufe (2002), sofern die lokale PAE nicht 
adressiert ist. Dementsprechend nimmt 2003a die Quittierung 
(GNT), ausgefahrt als RDY/ACK gemafi dem bekannten Protokoll, 
entweder von 2002 Oder von 2004 entgegen. 

Dadurch entsteht ein gepipelineter Bus, der die CW von der CT 
zur adressierten PAE und deren Quittung zurttck zur CT 
tlbertragt. 
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Wenn WCT bei 2004 aktiv ist, werden die anstehenden CW, die 
beschreibungsgemSfi mit WAVE gekennzeichnet sind, in 2004 
konfiguriert, GNT wird mit ACK quittiert. 
Solange WCT nicht aktiv ist, aber CW zur Konfiguration 
anliegen, wird GNT nicht quittiert, d.h. die Pipeline ist bis 
zur DurchfOhrung der Konfiguration blockiert. 
Erwartet 2005 eine Wave-Rekonfiguration, gekennzeichnet durch 
ein aktives WCT und keine mit WAVE gekennzeichneten CW liegen 
bei 2004 vor, quittiert 2004 mit WAIT um die PAE (2005) 
solange in einen wartenden, nicht datenverarbeitenden Zustand 
zu versetzen, bis mit WAVE gekennzeichnete CW in 2004 
konfiguriert wurden. 

CW^ die nicht mit WAVE tibertragen wurden, werden wShrend der 
Datenverarbeitung mit RE J zurtickgewiesen. 

Es soil angemerkt sein, da5 diese Figur ausschliefilich das 
Grundprinzip verdeutlichen soil. Durch applikationsabhSngige 
besondere Ausgestaltungen k6nnen Optimierungen durchgeftihrt 
werden. Beispielsweise kann durch. eine Registerstufe in 2004, 
die eingehende mit WAVE gekennzeichnete CW bis zum Eintreffen 
von WCT und der damit verbundenen Re konfiguration 
zwischenspeichert, das Blockieren der Pipeline verhindert 
werden, wenn von der CT gesendete CW nicht sofort von der 
adressierten 2004 abgenommen werden. 

2010 und 2011 sollen die Richtung der Datenverarbeitung zur 
weiteren ErlSluterung kennzeichnen. 
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sofern die Datenverarbeitung in Richtung 2010 veriauft, ist 
eine schnelle Wave-Rekonfiguration der PAEs wie folgt moglich: 
Die CT sendet die mit WAVE gekennzeichneten CW derart in die 
Pipeline, daB.zunachst die CW der am weitesten entfernten PAE 
gesendet werden. Sofern die CW nicht sofort konfiguriert 
werden kftnnen ist die entfemteste Pipeline-Stufe (2002) 
blockiert. Danach sendet die CT die CW an die nunmehr 
entfemteste PAE und so weiter, bis zuletzt die Daten an die 
nSchste PAE gesendet werden. 

Sobald ChkPkt durch die PAEs ISuft k6nnen jetzt in jedem Takt 
die neuen CW konfiguriert werden. Das Verfahren ist auch dann 
effizient, wenn ChgPkt zeitgleich mit der Obertragung der CW 
von der CT durch die PAEs ISuft, da auch dabei das jeweils zur 
Konfiguration erforderliche CW an der jeweiligen PAE in jedem 
Takt anstehen kann. 

Veriauft die Datenverarbeitung in die entgegengesetzte 
Richtung (2011), kann ebenfalls die Pipeline von der der CT 
entfemtesten PAE zu der der CT nSchsten PAE konfiguriert 
werden. Sofern ChgPkt nicht zeitgleich mit der 
DatenObertragung der CW erfolgt, bleibt das Verfahren optimal, 
da bei Auftreten von ChgPkt die CW sofort aus der Pipeline in 
die 2004 Obertragen werden kann. 

Erscheint ChgPkt jedoch zeitgleich mit den CW der Wave 
Rekonfiguration, entstehen Wartezyklen. Beispielsweise soil 
beim Auftreten von ChgPkt zum Takt n die PAE B konfiguriert 
werden. Die CW stehen an und werden in 2004 konfiguriert. Beim 
Takt n+1 liegt ChgPkt (und damit WCT) bei PAE C an. Die CW von 
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PAE C werden aber in diesem Takt bestenfalls erst in 2002 von 
PAE B tibertragen, da im vorhergehenden Takt 2002 von PAE B 
noch mit deren CW belegt war* Erst im Takt n+2 liegen die CW 
von PAE C in deren 2002 und k^nnen konfiguriert werden. In 
Takt n+1 ist ein Wartezyklus entstanden. 

Fxgur 21 zeigt die allgemeinste Synchronistionsstrategie fdr 
eine Wave*Rekonfiguration. Bine erste PAE 2101 erkennt die 
Notwendigkeit einer Rekonfiguration aufgrund eines 
auftretenden Zustandes. Das Erkennen kann nach gew6hnlichen 
Verfahren, beispielsweise einem Vergleich von Daten Oder 
Zustanden erfolgen. Durch das Erkennen sendet 2101 ein 
Aufforderung (2103), die durch einen Trigger erfolgen kann, an 
eine Oder mehrere zu rekonf igurierenden PAEs (2102), das die 
Datenverarbeitung anh£Llt. Weiterhin sendet 2101 ein Signal 
(2105), das auch dasselbe Signal 2103 sein kann) an eine CT 
(2104), um dlese zur Rekonfiguration aufzufordern. 2104 
rekonfiguriert 2102 (2106) und informiert (2107) nach 
erfolgter Rekonfiguration aller zu rekonfigurierenden PAEs 
2101 gegebenenfalls mittels Rekonfiguration Uber die 
Beendigung der Durchfahrung. Daraufhin nimmt 2001 die 
Anhalteaufforderung 2103 zurtlck und die Datenverarbeitung wird 
fortgesetzt. 2108 und 2109 symbolisieren jeweils Daten- und 
Trigger- Ein- und AusgSnge. 

Figur 22 veranschaulicht eine Mdglichkeit durch Routing* 
MaBnahmen far eine korrekte zeitliche Weiterleitung von WCT zu 
sorgen. Von einer zentralen Instanz (2203) werden mehrere WCT 
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far verschiedene PAEs (2201) generiert, die jedoch zeitlich 
aufeinander abgestimmt sein sollen. Die unterschiedlichen 
Entfernungen der 2201 in der Matrix fQhren zu 
unterschiedlichen Laufzeiten, bzw. Latenzzeiten. Dies wird in 
dem vorliegenden Beispiel durch das geeignete Einsetzen von 
Pipelinestufen (2202) durch den, dem Compiler zugeordneten 
Router, erreicht (vgl. PACT13)* Die sich dadurch ergebenden 
Latenzen sind mit dl-d5 angegeben. £s 1st ersichtlich, dafi in 
Richtung des Datenflusses (2204) in jeder Stufe (Spalte) 
dieselben Latenzen auftreten. Beispielsweise ware 2205 nicht 
notwendig, da die Entfernung von 2206 von 2203 sehr gering 
ist. Da aber ftlr 2207 und 2208 je ein 2202 aufgrund der durch 
die l^ngere Distanz entstehenden Laufzeit eingeftigt werden 
muB, wird 2205 zum Abgleich der Laufzeit notwendig. 

Figizr 23 soli eine Anwendung der Wave-Rekonfiguration 
aufzeigen. Dabei soli ein wesentlicher Vorteil der VPU- 
Technologie aufgezeigt werden, namlich die wahlweise Nutzung 
von PAE-Ressourcen oder Rekonfigurationszeit zur L^sung einer 
Aufgabe, woraus sich ein vom Compiler bzw. Programmierer 
einstellbarer intelligenter Tradeoff zwischen Kosten und 
Performance ergibt. 

Ein Datenstrom soil (2301) in einera Array (2302) aus PAEs 
(2304-2308) berechnet werden. Dem Array ist eine CT (2303) 
zugeordnet, die ftir dessen Rekonfiguration zustandig ist. 2304 
ist far die Erkennung des Endzustandes der Datenverarbeitung 
der eine Rekonfiguration erforderlich macht zustandig. Die 
Erkennung wird an die CT signalisiert . 2306 kennzeichnet den 
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Beginn und 2309 das Ende einer Verzweigung, die durch (2307a, 
2307b, bzw. 2307ab) symbolisiert ist. Die PAEs 2308 werden 
nicht verwendet. Die unterschiedlichen Trigger werden durch 
2309 dargestellt. 

In Pigur 23a wird durch 2305 einer der beiden Zweige 2307a, 
2307b selektiert und per Trigger zeitgleich mit den von 2306 
eintreffenden Daten aktiviert. 

In Fignr 23b soil aus 2307a und 2307b nicht kQii«)lett 
vorkonfiguriert sein, sondem beide mdglichen Zweige sollen 
sich die Ressourcen 2307ab durch Rekonfiguration teilen. 2305 
selektiert weiterhin den far die Datenverarbeitung notwendigen 
Zweig. Die Information wird jetzt einerseits an 2303 gefUhrt, 
andererseits an 2306, xm gemaB Figur 21 die Datenverarbeitung 
bis zur komplett durchgefQhrten Rekonfiguration von 2307ab 
anzuhalten. 

Figur 24 stellt eine mOgliche alternative Implementierung 
gem&& 4.2 einer Statemachine zur Ablaufsteuerung der PAE dar: 
• Folgende ZustSnde sind implementiert : 
Not Configured (2401) 
Allocated (2402) 
wait for Lock (2403) 
Configured (2404) 

Folgende Signale lOsen eine ZustandsSnderung aus: 
LOCK/FREE (2404, 2408) 
CHECK (2405, 2407) 
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RECONFIG (2406, 2409) 
GO (2410, 2411) 

Figur 25 zeigt den aus PACT 13 bekannten Aufbau eines 
Hochsprachencompilers, der beispielsweise auch gewOhnliche 
sequentielle Hochsprachen (C, Pascal/ Java) auf ein VPU-'System 
Qbersetzt. Sequentieller Code (2511) wird von parallelem Code 
(2508) getrenntr wodurch 2508 direkt in dem Array von PAEs 
verarbeitet wird. 

Fttr 2511 gibt es drei AusfahrimgsmOglichkeiten; 

1. Innerhalb eines Sequenzers einer PAE (vgl. PACT13, 2910) 

2. Mittels eines in die VPU konf igurierten Sequenzers, Der 
Con?>iler erzeugt hierzu einerseits einen auf die Aufgabe 
optimierten Sequenzer, andererseits direkt den 
algorithmenspezifischen Sequenzercode (vgl. PACT13, 2801). 

3. Auf einem gewdhnlichen externen Prozessor (vgl. PACT13, 
3103) 

4. Durch schnelle Rekonflguration mittels einer CT, indem das 
Verhaltnis zwischen der T^zahl der PAEs innerhalb einer PAC 
und der Anzahl der PACs derart gewahlt wird, daft eine Oder 
mehrere PACs als dedizierte Sequenzer aufgebaut werden kannen, 
dessen Opcodes und Befehlsausftihrung von der zugeordneten CT 
in jedem Arbeitsschritt konfiguriert werden. Dabei reagiert 
die zugeordnete CT auf den Status des Sequenzers, um den 
jeweils nachfolgenden Programmablauf zu bes tinmen. Die 
Obertragung des Status erfolgt mittels des Triggersystems . 
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Welche MOglichkeit gewShlt wird, hangt von der Architektur der 
VPD, des Computersystems und des Algorithmus ab. 

Das Prinzip ist aus PACT13 bekannt. Es soli jedoch 
ausdrucklich auf die Erweiterungen des Routers und Placers 
(2505) entsprechend der hier vorliegenden Offenbarung 
hingewiesen werden. 

Der Code (2501) wird zunSchst in einem Praprozessor (2502) in 
DatenfluBcode (2516) (der in einer speziellen Version der 
jeweiligen Programmiersprache datenf luBoptimiert geschrieben 
wurde) und gewohnlichen sequentiellen Code getrennt (2517). 
2517 wird auf parallelisierbare Teilalgorithmen untersucht 
(2503), die sequentiellen Teilalgorithmen werden ausgesondert 
(2518) . Die parallelisierbaren Teilalgorithmen werden als 
Makros voriaufig plaziert und geroutet. 
In einem iterativen Prozess werden die Makros mit dem 
datenf luBoptimierten Code (2513) zusammen plaziert, geroutet 
und partitioniert (2505) . Bine Statistik (2506) wertet die 
einzelnen Makros, sowie deren Partitionierung hinsichtlich der 
Bffizienz aus, wobei die Umkonfigurationszeit und der Aufwand 
der Umkonfiguration in die Bf fizienzbetrachtung einflieOt. 
Ineffiziente Makros werden entfernt und als sequentieller Code 
ausgesondert (2514) . 

Der verbleibende parallele Code (2515) wird zusammen mit 2516 
compiliert und assembliert (2507) und VPO Objektcode 
ausgegeben (2508) . 
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Eine Statistik tiber die Effizienz des generierten Codes, sowie 
der einzeinen (auch der mit 2514 entfernten MaJcros) wird 
ausgegeben (2509), der Programmierer erhait dadurch 
wesentliche Hinweise auf Geschwindigkeitsoptimierungen des 
Programmes. 

Jedes Makro des verbleibenden sequentiellen Codes wird auf 
seine Komplexitat und Anforderungen untersucht (2520) • Aus 
einer Datenbank die von der VPO-Architektur und dem 
Computersystem abhSngt (2519) wird der jeweils geeignete 
Sequenzer ausgewShlt und als VPa-Code (2521) ausgegeben, Ein 
Compiler (2521) generiert den Assembler code des jeweiligen 
Makros fiir den jeweils von 2520 gewahlten Sequenzer und gibt 
ihn aus (2511) . Die 2510 und 2520 sind eng miteinander 
verkntipft, Gegebenenfalls verlSuft die Abarbeitung iterativ um 
den geeignetsten Sequenzer mit minimalsten und schnellsten 
Assemblercode zu finden. 

Ein Linker (2522) fafit die Assemblercodes (2508, 2511, 2521} 
zusammen und generiert den ausfflhrbaren Objektcode (2523) . 
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Begrlff8de£inltionen 

aCK/BBJ Quittierungsprotokoll einer PAE auf einen 
{Re)Konfigurationsversuch. ACK zeigt an dafi die 
Konfiguration angenommen wurde, REJ zeigt an dafi die 
Konfiguration abgelehnt vmrde. Das Protokoll sieht vox, daB 
auf das Eintreffen von entweder ACK oder REJ gewartet wird 
und ggf . bis dahin Wartezyklen eingefQgt werden. 

CI Einheit zum interaktiven konfigurieren und 

rekonfigurieren von konfigurierbaren Blementen. Eine CT 
besitzt einen Speicher zum Zwischenspeichern und/oder Cachen 
von SubConf . In besonderen Ausgestaltungen besitzen auch 
CTs, die keine Root-CT sind, direkten AnschluB an einen 
speicher fUr SubConf, der in diesem Fall nicht von einer 
darOberliegenden CT geladen wird. 

CTTOBB Bin- oder mehrdimensionaler Baum von CTs. 

BnhSobConf Konfiguration die mehrere SubConf, die auf 
unterschiedlichen PACs auszufOhren sind, beinhaltet. 

Konfi«uratioa Konpletter ausftthrbarer Algorithmus . 

konfigurierbares Blemeat Physikalisch beliebiges Element, 
dessen exakte Funktion innerhalb der implementierten 
MOglichkeiten durch eine Konfiguration bestimmt wird. 
insbesondere kann ein konfigurierbares Element als logische 
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Funktionseinheit^ arithmetische Funktionseinheit, Speicher, 
peripheres Interface, Bussystem ausgestaltet sein; wobei 
besonders Elemente bekannter Technologien wie FPGAs (z.B. 
CLBs), DPGAs, VPUs und sSmtliche unter ,,reconf igurable 
computing^^ bekaimte Elemente eingeschlossen slnd* Ein 
konfigurlerbares Element kann auch eine komplexer 
ZusammenschluB mehrerer unterschiedlicher Funktionseinheiten 
sein, z.B. einer arithmetlschen Einheit mit integriertem 
zugeordnetem Bussystem. 

KW Konf igurationswort . Ein oder mehrere Daten, die die 
Konf iguration oder einen Teil einer Koafiguration eines 
konfigurierbaren Elementes bestimmenp 

Latenz Verz5gerung innerhalb einer Datentibertragung, die 
gew6hnlicherweise in synchronen Systemen taktbasierend 
erfolgt und daher in Taktzyklen angeben wird. 

SA Processing Array, Anordnung mehrerer auch unterschiedlich 
ausgestalteter PAEs 

PAC Ein PA mit der zugeordneten fttr die Konfiguration und 
Rekonfiguration dieses PAs zustSndigen CT 

VAB Processing Array Element, konfigurlerbares Element 
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BeconfHeq Trigger aufgrund eines Zustandes der eine 

Rekonfiguration erfordert generiert werden und selbigen 
kennzeichnen. 

rekonfigurieren Laden einer neuen Konfiguration, ggf . 
zeitgleich oder Qberlagernd oder parallel zu einer 
Datenverarbeitung, ohne die ablaufende Datenverarbeitung zu 
behindern oder zu verfalschen. 

Boot-CT HOchste CT im CTTREE, besitzt fttr gewOhnlich aber 
nicht ausschlieBlich als einzige CT einen AnachluB an den 
Konf igurationsspeicher . 

SobConf Teil einer Konfiguration bestehend aus mehreren KW. 

KCX Kennzeichnet den Zeitpunkt zu dem eine Rekonfiguration zu 
erfolgen hat. Kann dabei optional durch Obertragung einer 
zusatzlichen Information eine aus mehreren mOglichen 
Konfiguration auswahlen. FQr gewahnlich verlSuft WCT exakt 
synchron mit dem Beenden der aktuell laufenden und zur 
Rekonfiguration zu beendenden Datenverarbeitung. Wird WCT 
aus implementierungsgrtlnden spater (ibertragen, wird WCS zur 
Synchronisierung der Datenverarbeitung verwendet. 

IICP Fordert eine oder mehrere alternative nfichste 

Konfiguration (en) bei der CT zum (Re) konf igurieren an. 



110 



wo 02/13000 



PCT/EPOl/06703 



WCS Stoppt die Datenverarbeitung bis zum Eintreffen von WCT. 
Mufl nur verwendet werden, wenn implementierungsbedingt WCT 
nicht exakt den Zeitpunkt der erforderlichen Rekonfiguration 
anzeigt, sondern erst nach dem eigentlichen Ende der 
Datenverarbeitung der zu beendeten Konfiguration bei der 
jeweilgen PAE eintrifft. 



Z*lle konfigurierbares Element 
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Batentanspradhe 

1. verfahren zum Betrieb einer Datenverarbeitungseinrichtung 
mit ein- oder mehrdimensionaler konfigurierbarer Zellstruktur, 
dadurch gekennzeichnet daB 

zusainmen mit den Konfigurationsdaten ein Flag gesendet wird, 
das anzeigt, daB eine zelle neu konfiguriert wird, wobei die 
Zelle daraufhin die Konfiguration annimmt sofern sie sich in 
einem unkonfigurierten Zustand bef and und ansonsten die 
Konfiguration verweigert- 

2. Verfahren zum Betrieb einer Datenverarbeitungseinrichtung 
mit ein- oder mehrdimensionaler konfigurierbarer Zellstruktur, 
dadurch gekennzeichnet daB 

zusammen mit den Konfigurationsdaten ein Flag gesendet wird, 
das anzeigt, daB eine Zelle teilweise konfiguriert wird, wobei 
die Zelle daraufhin die Konfiguration annimmt sofern sie sich 
in einem konfigurierten Zustand befand und ansonsten die 
Konfiguration verweigert. 

3. Verfahren zum Betrieb einer Datenverarbeitungseinrichtung 
mit ein- oder mehrdimensionaler konfigurierbarer Zellstruktur, 
dadurch gekennzeichnet daB 

eine Zelle durch ein bestimmtes Flag gestartet wird. 
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